HDFS HA 模式namenode1无法启动，JournalNode报错

皮皮阿~

已于 2023-09-26 10:13:48 修改

阅读量691

点赞数 1

CC 4.0 BY-SA版权

文章标签： hdfs hadoop 大数据

于 2023-09-25 22:56:03 首次发布

本文链接：https://blog.csdn.net/iisbeginner/article/details/133282681

文章讲述了HDFS中JournalNode的作用，当Namenode出现问题时，如何通过检查JournalNode日志、备份元数据并恢复JournalNode节点，确保数据一致性。最后处理文件块损坏的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、问题描述
数据突然写不进去，重启hdfs发现datasophon01节点namenode掉线

grep “ERROR” xxx.log 查看日志报错
1.1 查看datasophon01 节点namenode报错
在这里插入图片描述

通过报错发现 JournalNode 有问题
1.2 查看 JournalNode 节点
在这里插入图片描述

报错日志
在这里插入图片描述
JournalNode 原理

为了保证 Active 节点和 Standby 节点，即可以可靠的保持数据的一致性，又不会影响集群的可用性，HDFS 在 Active 节点和 Standby 节点之间引入了另外一个节点 JournalNode 节点。

        JournalNode 节点作为 Active 节点和 Standby 节点的中间节点，它为两个节点解决了数据的同步的问题。首先 Active 节点会将元数据发送给 JournalNode 节点，然后 Standby 节点会从 JournalNode 节点获取需要同步的元数据。即使 Standby 节点故障了、产生问题了，在它恢复正常状态后，也可以从 JournalNode 节点中同步相应的数据。这就要求 JournalNode 节点需要有持久化的功能来保证元数据不丢。

        但是，问题又来了，JournalNode 节点如果挂掉又怎么办？那么这就对 Journa

最低0.47元/天解锁文章

200万优质内容无限畅学