OpenShift常用维护命令

原创于 2025-05-16 10:21:19 发布 · 284 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#openshift

Kubernetes 专栏收录该内容

80 篇文章

订阅专栏

1.查看日志

例如:

oc log controller-manager-rtt8k  -n kube-service-catalog

2.删除pod/node

2.1 oc  delete  pod   e3plus-system-40-57rtj  -n e3plus
2.2 oc delete node k8s-mq203

3.查询pod归属node

3.1 oc get  pods --all-namespaces -owide|grep 198
3.2 oc get pods -n kube-service-catalog -owide
3.3 oc get nodes

4.docker镜像导入和打tag

例如:docker load -i ImageId
例如:docker tag   e6d4226c7cc0  nexus-registry-cicd.apps.paas.baison.net:10000/openshift/origin-deployer:v3.11.0

5.进入pod

例如:oc exec -it   e3plus-front-pos-110-v6td6  bash

6.查看标签

例如:oc get node --show-labels
例如:oc get node --show-labels  | grep ec

7.更新证书

命令:for i in `oc get csr | grep Pending | awk '{print $1}' | grep -v NAME`;do oc adm certificate approve $i;done

8.排空节点上所有的pod

8.1 oc adm manage-node k8s-es206 --evacuate
8.2 oc adm policy add-cluster-role-to-user
8.3 oc adm policy
8.4 oc adm manage-node k8s-es206 --evacuate
8.5 oc adm manage-node k8s-es206 --schedulable=true
8.6 oc adm manage-node k8s-es206 --schedulable=false
8.7 oc adm uncordon k8s-mq203
8.8 oc adm cordon k8s-mq204
8.9 oc adm policy add-cluster-role-to-user -h

9.磁盘清理

1 查看下当前磁盘空间
2 进入overlay2目录  cd /data/docker/overlay2
3 查出来对应大文件名   du -h --max-depth=1 | sort -hr | head -n 10
4 根据文件名称查询出容器应用
docker ps -q | xargs docker inspect --format '{{.State.Pid}}, {{.Id}}, {{.Name}}, {{.GraphDriver.Data.WorkDir}}' | grep "文件名"

eg：
docker ps -q | xargs docker inspect --format '{{.State.Pid}}, {{.Id}}, {{.Name}}, {{.GraphDriver.Data.WorkDir}}' | grep "462467940a0927535a824bba531f9735036d0bdbdd6f47dc382497f4fbdbfde5"
5、重启对应容器应用

10.多余镜像容器清理

docker system prune -a    清除无用的镜像，删除关闭的容器、无用的数据卷和网络
docker system df   查看镜像容器总数

11.es日志清理

curl  -XGET  http://172.16.10.78:9200/_cat/shards?v
curl  -XGET  http://172.16.10.78:9200/_cat/health?v  查看节点健康数
curl  -XGET http://172.16.10.78:9200/_cat/indices   查看索引信息及空间占用
curl  -XDELETE  http://172.16.10.78:9200/索引名    删除单个索引

shell脚本（定时清理es索引日志）

#!/bin/bash


date1=`date  -d ' days ago' +%Y%m%d`
date2=`date  -d '10 days ago' +%Y.%m.%d`
for i in `seq 3`
do
  curl -XDELETE http://es:9200/*$date1*    # es为es集群的访问地址
  sleep 30
  curl -XDELETE http://es:9200/*$date2*    # es为es集群的访问地址
  if [ $i -lt 3 ];then
    sleep 30
  fi
done


crontab -e
45 23 * * * /usr/bin/sh  /data/delete_log.sh &> /dev/null &

12.CPU使用情况查看

使用vmstat命令查看：
vmstat -n 1 5
注：返回结果中的主要数据列说明如下。

r：表示系统中CPU等待处理的线程。一个CPU每次只能处理一个线程，所以该数值越大，通常表示系统运行越慢。
us：用户模式消耗的CPU时间百分比。该值较高时，说明用户进程消耗的CPU时间比较多。如果该值长期超过50%，则需要对程序算法或代码等进行优化。
sy：内核模式消耗的CPU时间百分比。
wa：IO等待消耗的CPU时间百分比。该值较高时，说明IO等待比较严重，这可能磁盘大量作随机访问造成的，也可能是磁盘性能出现了瓶颈。
id：处于空闲状态的CPU时间百分比。如果该值持续为0，同时sy是us的两倍，则通常说明系统面临CPU资源短缺。

13.业务启动顺序

业务的启动顺序为system、support、goods、price   其他

14.OpenShift证书批准及查询证书过期时间（每年更新）

oc get csr | grep -i pending | awk '{print $1}' | xargs oc adm certificate approve

for i in /etc/origin/master/*.crt;do echo $i; openssl x509 -in $i -text -noout | egrep "Not Before|Not After";echo "-----------";done
for i in /etc/origin/node/*.crt;do echo $i; openssl x509 -in $i -text -noout | egrep "Not Before|Not After";echo "-----------";done
徐延给的命令:（实际操作是可行的）
for i in `oc get csr | grep Pending | awk '{print $1}' | grep -v NAME`;do echo  $i;done

15.OpenShift创建管理员用户和密码（https://www.cnblogs.com/robin788/p/16150938.html）

# ansible masters -m shell -a 'htpasswd -b /etc/origin/master/htpasswd admin admin'
# ansible masters -m shell -a 'oc adm policy add-cluster-role-to-user cluster-admin admin'
*******oc adm policy add-role-to-user <role> <user> -n <project>*******指定项目中的用户权限
例：oc adm policy add-role-to-user view user -n e3plus

16.oc相关操作

oc get pod --all-namespaces -o wide  //查看pod
oc rollout history DeploymentConfig/dc-name  //查看dc历史版本
oc rollout history DeploymentConfig/dc-name --revision=5 //回滚到5版本
oc scale dc pod-name --replicas=3 -n namespace //设置副本数为3
oc delete pod pod-name -n namespace-name  //重启pod
oc logs -f pod-name //查看pod log
oc adm top pods //查看pod资源状态
oc adm top node //查看节点资源状态

17.中台admin密码忘记修改

把system库中的sys_userinfo表的字段password改成bQlBCxh6kF6qc58Gjv9BXw==
另外在把create_time改成2019-11-13 00:00:00   翻译过来的密码就是  1qaz@wsx

18.测试环境rabbitmq连接信息

# rabbit
# spring.rabbitmq.host=172.16.61.168
# spring.rabbitmq.port=31569
# spring.rabbitmq.username=admin
# spring.rabbitmq.password=e3plus