- 博客(27)
- 收藏
- 关注
原创 influxdb-集群单节点未正常工作makeslice: len out of range
发现influxdb有节点没有正常提供服务。#需要移除 “hh” 队列数据并重启服务。
2025-06-08 20:00:35
96
原创 influxdb数据库磁盘写满重启后写入报错no space left on device
客户端写入influxdb时报错no space left on device。
2025-06-08 09:29:49
367
原创 prometheus-operator问题记录-部分nodeexporter无数据问题
使用虚拟机部署的k8s集群,一键部署了prometheus-operator,在某些场景下,比如关机后开机,nodeexporter重启,在grafana面板会缺少部分集群节点的监控。curl 节点IP:9100 异常节点的响应非常慢,怀疑是节点网络存在问题,通过同节点的svc nodeport测试发现curl nodeport响应没有问题,定位问题还是在服务本身。首先有节点有数据,排除采集链路问题,定位单点问题,通过top po 发现未上报数据的节点exporter的CPU会高于其他正常节点。
2025-03-01 22:13:27
375
原创 麒麟系统误操作将/lib文件夹移除解决办法
麒麟默认账号密码:“root/Kylin123123”重启操作系统到开机界面时,按住e键进入单用户模式。exit退出当前系统等待操作系统重启后恢复。成功进入系统后找到对应的目录进行移动。清楚目录被移动的目标路径。
2024-11-23 13:23:58
1048
原创 麒麟操作系统只读readonly file system问题
touch内容时提示readonly file system。mount -o remount,rw / #调整为读写解决。检查物理机multipath -ll 未发现有异常链路。机器为云主机,检查同物理机上其他机器是否有一样的问题。mount 查看时发现根文件系统模式为ro状态。检查操作系统/etc/fstab文件内容。vnc页面存在OSError 提示。检查操作系统mount挂载。检查ceph存储状态。
2024-11-23 13:15:35
867
原创 k8s-v1.26版本开始kube-proxy不支持集群service地址icmp探测,无法集群内ping通
怀疑版本问题,但是查阅官方文档没有发现对这方面的改动,手动测试发现,v1.26第一个测试版本就已经添加了这条规则,并且kube-proxyr日志没有更新service相关的关联地址信息,v1.25最后一个版本则没有这条更新,并且正常打印service的地址信息更新。手动将这条规则删除后,service能正常ping通,但是会被kube-proxy刷回去。
2024-11-09 20:50:51
263
原创 k8s网络故障-目标端口号大于 32768&源端口号小于16384,数据报文源端口被操作系统篡改随机新端口问题记录
49152-65535: 被称为 动态/私有端口(Dynamic/Private Ports),通常由操作系统动态分配(也叫临时端口,ephemeral ports)。0-1023: 被称为 知名端口(Well-known Ports),通常分配给系统级服务或知名协议(如 HTTP 的 80,HTTPS 的 443 等)。TCP/UDP 协议中,端口号是一个 16 位无符号整数,因此其取值范围为 0 到 65535 (2的16次方-12的16次方)
2024-11-09 20:20:25
508
原创 自建Harbor仓库设置systemd管理并开机自启动方法
需要注意的是部分资料使用的是up/down来进行启停docker-compose,使用down停止时会把容器进行Remo删除,不方便后期维护,使用stop会避免这个问题。Harbor设置systemd管理开机自启动。
2024-10-13 22:01:27
522
原创 记录cordns部署时调度到部分节点crash报错
GitHub issues地址:https://github.com/labring/sealos/issues/2074。CoreDNS版本: registry.k8s.io/coredns/coredns:v1.9.3。内核版本:Linux 5.4.99-1.el7.elrepo.x86_64。Kubernetes版本: Kubernetes v1.26.14。删掉Configmap中loop那行配置。经过查询发现为CoreDNS BUG。
2024-10-13 18:44:55
231
原创 metrics.k8s.io/v1beta1: the server is currently unable to handle the request记录operator部署Prometheus
【代码】metrics.k8s.io/v1beta1: the server is currently unable to handle the request记录operator部署Prometheus。
2024-10-13 18:05:59
500
原创 记录一次linux系统恢复过程,bin目录被误删导致系统异常
使用cp -rp命令将完整目录进行拷贝,注意是真实覆盖,如果原来的操作系统的文件要保留就cp到sysimage下的其他目录,cp完成后检查sysimage下的目录是否和原始一致,reboot或者exit即可,将挂载的iso文件卸载或者断开。mnt下的sysimage为原始操作系统目录,其他为当前挂载镜像文件系统目录。选中第二项Rescue a CentOS system。虚拟机关机后,点击进入固件,进入bios系统。等待一阵会进入命令界面,输入1回车,再回车。保证CD/DVD是连接状态。
2024-09-16 21:36:20
1208
原创 kubevirt修改组件副本数声明cr和crd
测试发现infra是正确的,workload的不清楚是对哪里进行调整。crd 可以换成任意资源参数。
2024-05-28 10:49:15
351
原创 k8s配置参数递归查询全局kubectl explain crd --recursive命令
【代码】k8s配置参数递归查询全局kubectl explain crd --recursive命令。
2024-05-28 10:38:59
141
原创 linux-root执行yum命令夯住,无响应,普通用户可以yumlist问题解决
用户反馈使用虚机root用户执行yum安装软件报错失败,执行yum list无响应,只能ctrl+z退出进程。最终发现存在一个dnf makecache --timer的进程。报错类似一些db问题:rpmdb open failed。怀疑有相关进程占用,导致yum执行后队列等待。执行yum命令会报错,没有不响应问题了。执行rpm --rebuilddb解决。kill -9 进程ID。查看是否有锁文件行为。重建 RPM 数据库。
2024-05-21 16:40:11
444
原创 kubevirt实现vm节点迁移,Message: cannot migrate VMI which does not use masquerade to connect to the pod报错
【代码】kubevirt实现vm节点迁移,Message: cannot migrate VMI which does not use masquerade to connect to the pod报错。
2024-05-13 13:34:18
489
原创 vmware虚拟机意外停电关机启动失败进入救援模式解决方案
修复完重启正常进入系统,但是会丢失一些数据,如果是k8s集群可能需要修复etcd。截图暂无,进入救援模式页面会提示哪个分区存在问题,我的是dm-0执行。
2024-05-12 20:15:45
667
原创 k8s-crio下载镜像报错error creating read-write layer with ID清理缓存
手动pull镜像会提示Status: Image is up to date for xxx。
2024-05-12 20:09:07
250
原创 k8s节点资源不足,容器升级导致其他podpending问题
问题背景维护云平台发现一个故障,用户需要升级influxdb数据库,升级时未检查服务器资源是否满足,通过平台变配后成功升级配置,但是过几分钟收到报障其他类型数据库不可用(数据库服务部署在同一套数据库服务器),后台查看服务处于pending状态解决方案回退升级的数据库,迁移,释放数据库实例都可以,测试环境和用户沟通最快的方式释放重建了根本原因k8sPod 优先级和抢占:priorityClassNamePriorityClass 对象可以设置任何小于或等于 10 亿的 32 位整数值。 这意味着
2024-05-11 11:19:19
399
原创 kubevirt安装报错virt-launcher”reason”,“reason”:“fork/exec /usr/bin/virt-launcher
如果组件都是正常开启的,检查docker版本,需要更新到最新版本26,23版本测试不支持。
2024-05-11 10:45:14
660
原创 go-gin框架下载github-wsarecv: An existing connection was forcibly closed by the remote host
【代码】go-gin框架下载github-wsarecv: An existing connection was forcibly closed by the remote host。
2024-04-03 10:44:04
289
1
原创 K8s集群某节点出现异常,新分配到node上面的pod不能ping通外部pod,同节点pod、宿主机IP也不行,外部pod也不可以ping通IP
(注:一定要云平台后台关机重启,测试过reboot启动后还是不行)###这里没分析到为什么旧的pod是正常网络的,可以ping出去,也正是这个问题一开始干扰了问题排查思路,应该是calico网卡维护了一部分路由表信息吧?
2023-07-28 15:57:00
1625
原创 达梦DM8数据库替换Mysql数据库,详细操作
数据迁移的前提是必须当前本地操作环境要和两边的数据库同时保持通信,一般我们生产环境的数据库都在内网,可以通过内网访问备份Mysql的sql文件导出到本地,在本地另起一个Mysql数据库服务进行导入。选择下一步后选进行数据库迁移选择项,列出了当前数据库支持的数据迁移类型,选择Mysql ==> DM,接下就是填写相关数据库信息,会话属性可不填,只需要填写你需要迁移的库名即可。源模式是Mysql,默认是开始选的数据库名,目的模式可以手动创建或者选择已创建的模式,如果新建建模式就勾选<创建模式>
2023-05-28 10:38:57
1294
1
原创 cowardly refusing to save to a terminal. Use the -o flag or redirect
docker save 镜像ID > *.tar。
2023-04-06 13:26:57
2292
1
原创 二进制部署k8s改kubeadm部署记录
二进制部署时该文件为手动创建的名字,需要在etc/profile/中的文件内容–export KUBECONFIG=/etc/kubernetes/admin.conf。kubeadm安装时需要注意有/usr/lib/systemd/system/kubelet.serivce.d/10-kubeadm.conf。删除或备份kubelet数据文件,/var/lib/kubelet/*7.admin.conf文件位于/etc/kubernetes/下。5. kubeadn初始化。
2023-03-26 14:04:47
356
1
原创 苹果iPhone手机用iTunes更新IOS14.3系统失败怎么解决
苹果iPhone手机用iTunes更新IOS14.3系统失败怎么解决苹果iPhone手机用iTunes更新IOS14.3系统失败怎么解决由于最近苹果新系统上线,做了不少宣传,在大家的推荐下拿出了自己多年的6sp进行了系统更新,由于内存剩余很少,选择用苹果官方升级辅助工具进行PC端更新,这里一定要注意,数据无价,备份一定要做好,不然亲人两行泪,手机连接PC端iTunes提示接入iPhone手机,手机进行授权,授权成功,iTunes会提示系统可以进行更新页面弹出,也可以点击屏幕上面的一个小手机图标logo
2020-12-17 10:20:47
10721
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人