Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

07-16 1130阅读

问题一、NameNode进程退出

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

我们发现,NameNode进程不存在。

情况1、单独启动NameNode

hdfs --daemon start namenode

能够正常拉起,那就没问题

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

情况2、无法独立启动NameNode

先尝试启动NameNode

hdfs --daemon start namenode

发现,没能成功启动

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

查看日志文件

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

tail -n 100 hadoop-atguigu-namenode-hadoop102.log

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

从报错信息看,是NameNode没有格式化。

但是,我们是格式化后,才启动的集群。

具体是文件没找到:

/opt/module/hadoop-3.1.3/data/dfs/name/in_use.lock

我们去改目录查看下情况

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

说明,可能NameNode的数据被误删了。

解决

从2nn节点上,拷贝元数据到相应目录即可。

我们,知道2nn和nn差别就在于少了一个progress文件。

进入2nn元数据目录

cd /opt/module/hadoop-3.1.3/data/dfs/namesecondary

拷贝数据

scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary/* /opt/module/hadoop-3.1.3/data/dfs/name

再次启动NameNode进程

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

测试删除

显示进群处于安全模式

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

退出安全模式

hdfs dfsadmin -safemode forceExit

Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

就可以正常使用了。

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]