Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。
问题一、NameNode进程退出
我们发现,NameNode进程不存在。
情况1、单独启动NameNode
hdfs --daemon start namenode
能够正常拉起,那就没问题
情况2、无法独立启动NameNode
先尝试启动NameNode
hdfs --daemon start namenode
发现,没能成功启动
查看日志文件
tail -n 100 hadoop-atguigu-namenode-hadoop102.log
从报错信息看,是NameNode没有格式化。
但是,我们是格式化后,才启动的集群。
具体是文件没找到:
/opt/module/hadoop-3.1.3/data/dfs/name/in_use.lock
我们去改目录查看下情况
说明,可能NameNode的数据被误删了。
解决
从2nn节点上,拷贝元数据到相应目录即可。
我们,知道2nn和nn差别就在于少了一个progress文件。
进入2nn元数据目录
cd /opt/module/hadoop-3.1.3/data/dfs/namesecondary
拷贝数据
scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary/* /opt/module/hadoop-3.1.3/data/dfs/name
再次启动NameNode进程
测试删除
显示进群处于安全模式
退出安全模式
hdfs dfsadmin -safemode forceExit
就可以正常使用了。
文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。