Hadoop HA active namenode 宕机无法自动切换到 standby namenode

本文介绍了在Hadoop HA集群中,当active namenode宕机时standby namenode无法自动切换的问题。通过查看日志发现是由于dfs.ha.fencing.methods参数设置不当,主要涉及sshfence和shell方法。解决问题的关键在于配置一个能确保在active namenode宕机时返回成功的fencing方法,如使用/bin/true确保返回0,从而触发故障转移。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、问题产生

搭建完 hadoop-HA 集群后,尝试了一下 kill 掉 active namenode 的进程发现可以快速的进行自动故障转移。在下午我准备尝试一下,直接将 active namenode 所在机器关机,用来模拟因为磁盘故障等物理因素导致服务器宕机的情况。但是发现,将 active namenode 关机后,standby namenode 无法自动故障转移,仍然是 standy 状态。这样,Hadoop 集群也无法正常工作,所以要解决这个问题。

二、查看日志

部分日志:

2020-03-13 14:47:22,993 WARN org.apache.hadoop.ha.HealthMonitor: Transport-level exception trying to monitor health of NameNode at hadoop101/192.168.2.101:9000: java.net.ConnectException: 拒绝连接 Call From hadoop101/192.168.2.101 to hadoop101:9000 failed on connection exception: java.net.ConnectException: 拒绝连接; For more details see:  http://wiki.apache.org/hadoop/ConnectionRefused
2020-03-13 14:47:24,996 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: hadoop101/192
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值