k8s是用的阿里的ACK集群,版本是1.20.11,docker版本19.03.15
下面是报错
查看pod的日志,无法查看
这时候NotReady的节点是无法通过ssh远程连接到的,但是ping包是可以回应的,22端口也可以通,通过监控查看资源配置
会发现cpu和内存会短时间骤增骤降,直接飙升到100%把内存和cpu打爆
这时候我们查看下Node节点有没有做资源配额,如果做了资源配额那么内存和cpu应该不会被打爆
后续查看了下deployment文件,我们在deployment的文件上加上了资源限制,这样启动就不会直接打爆node的cpu和内存了,这样node节点就不会NotReady了。
这样Node资源就不会被打爆了