CDH报错解决:该主机与 Cloudera Manager Server 失去联系的时间过长。该主机未与 Host Monitor 建立联系。

本文详细介绍了当Cloudera Manager中节点与CM Server失去联系时的诊断与解决步骤,包括检查机器状态、代理启动情况、网络配置及数据库连接,并提供了具体的解决方法,如修改cm_guid等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概述


说明下,qichu这里是由于集群资源有限,在最初配置如下:

Master	172.20.10.100
Slave1	172.20.10.10
Slave2	172.20.10.20


问题描述


如下图所示,该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系。
在这里插入图片描述

解决方法


要解决此问题,请确保以下的配置或设置正确

  1. 问题节点所在的机器已经启动

  2. 问题节点上的代理Agent已经启动,即service cloudera-scm-agent status显示active(running)
    在这里插入图片描述

  3. 问题节点与主机节点上的/etc/hosts配置文件中,iphostname是正确对应的。

  4. 如果使用的是mysql保存源数据,那么确保当前数据库端口启动(日志中有提到过9000端口无法访问),使用netstat -an | grep 9000查看是否启动
    在这里插入图片描述

  5. cm_uuid不匹配问题,查看日志如下图:
    在这里插入图片描述在每个节点上,/var/lib/cloudera-scm-agent 这个目录是自动生成的,里面的cm_guid是ClouderaManager的guid:
    在这里插入图片描述
    所以如果重复添加主机,那就需要
    5.1 先删除此节点上的cm_guid:即在问题节点上执行sudo rm /var/lib/cloudera-scm-agent/cm_guid
    5.2 将此问题主机先从Clouera Manager中移除
    在这里插入图片描述
    5.3 然后再在集群中添加此问题主机:
    在这里插入图片描述
    可以发现不再出现报错:
    在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值