1.查看日志
例如:
oc log controller-manager-rtt8k -n kube-service-catalog
2.删除pod/node
2.1 oc delete pod e3plus-system-40-57rtj -n e3plus
2.2 oc delete node k8s-mq203
3.查询pod归属node
3.1 oc get pods --all-namespaces -owide|grep 198
3.2 oc get pods -n kube-service-catalog -owide
3.3 oc get nodes
4.docker镜像导入和打tag
例如:docker load -i ImageId
例如:docker tag e6d4226c7cc0 nexus-registry-cicd.apps.paas.baison.net:10000/openshift/origin-deployer:v3.11.0
5.进入pod
例如:oc exec -it e3plus-front-pos-110-v6td6 bash
6.查看标签
例如:oc get node --show-labels
例如:oc get node --show-labels | grep ec
7.更新证书
命令:for i in `oc get csr | grep Pending | awk '{print $1}' | grep -v NAME`;do oc adm certificate approve $i;done
8.排空节点上所有的pod
8.1 oc adm manage-node k8s-es206 --evacuate
8.2 oc adm policy add-cluster-role-to-user
8.3 oc adm policy
8.4 oc adm manage-node k8s-es206 --evacuate
8.5 oc adm manage-node k8s-es206 --schedulable=true
8.6 oc adm manage-node k8s-es206 --schedulable=false
8.7 oc adm uncordon k8s-mq203
8.8 oc adm cordon k8s-mq204
8.9 oc adm policy add-cluster-role-to-user -h
9.磁盘清理
1 查看下当前磁盘空间
2 进入overlay2目录 cd /data/docker/overlay2
3 查出来对应大文件名 du -h --max-depth=1 | sort -hr | head -n 10
4 根据文件名称查询出容器应用
docker ps -q | xargs docker inspect --format '{{.State.Pid}}, {{.Id}}, {{.Name}}, {{.GraphDriver.Data.WorkDir}}' | grep "文件名"
eg:
docker ps -q | xargs docker inspect --format '{{.State.Pid}}, {{.Id}}, {{.Name}}, {{.GraphDriver.Data.WorkDir}}' | grep "462467940a0927535a824bba531f9735036d0bdbdd6f47dc382497f4fbdbfde5"
5、重启对应容器应用
10.多余镜像容器清理
docker system prune -a 清除无用的镜像,删除关闭的容器、无用的数据卷和网络
docker system df 查看镜像容器总数
11.es日志清理
curl -XGET http://172.16.10.78:9200/_cat/shards?v
curl -XGET http://172.16.10.78:9200/_cat/health?v 查看节点健康数
curl -XGET http://172.16.10.78:9200/_cat/indices 查看索引信息及空间占用
curl -XDELETE http://172.16.10.78:9200/索引名 删除单个索引
shell脚本(定时清理es索引日志)
#!/bin/bash
date1=`date -d ' days ago' +%Y%m%d`
date2=`date -d '10 days ago' +%Y.%m.%d`
for i in `seq 3`
do
curl -XDELETE http://es:9200/*$date1* # es为es集群的访问地址
sleep 30
curl -XDELETE http://es:9200/*$date2* # es为es集群的访问地址
if [ $i -lt 3 ];then
sleep 30
fi
done
crontab -e
45 23 * * * /usr/bin/sh /data/delete_log.sh &> /dev/null &
12.CPU使用情况查看
使用vmstat命令查看:
vmstat -n 1 5
注:返回结果中的主要数据列说明如下。
r:表示系统中CPU等待处理的线程。一个CPU每次只能处理一个线程,所以该数值越大,通常表示系统运行越慢。
us:用户模式消耗的CPU时间百分比。该值较高时,说明用户进程消耗的CPU时间比较多。如果该值长期超过50%,则需要对程序算法或代码等进行优化。
sy:内核模式消耗的CPU时间百分比。
wa:IO等待消耗的CPU时间百分比。该值较高时,说明IO等待比较严重,这可能磁盘大量作随机访问造成的,也可能是磁盘性能出现了瓶颈。
id:处于空闲状态的CPU时间百分比。如果该值持续为0,同时sy是us的两倍,则通常说明系统面临CPU资源短缺。
13.业务启动顺序
业务的启动顺序为system、support、goods、price 其他
14.OpenShift证书批准及查询证书过期时间 (每年更新)
oc get csr | grep -i pending | awk '{print $1}' | xargs oc adm certificate approve
for i in /etc/origin/master/*.crt;do echo $i; openssl x509 -in $i -text -noout | egrep "Not Before|Not After";echo "-----------";done
for i in /etc/origin/node/*.crt;do echo $i; openssl x509 -in $i -text -noout | egrep "Not Before|Not After";echo "-----------";done
徐延给的命令:(实际操作是可行的)
for i in `oc get csr | grep Pending | awk '{print $1}' | grep -v NAME`;do echo $i;done
15.OpenShift创建管理员用户和密码(https://www.cnblogs.com/robin788/p/16150938.html)
# ansible masters -m shell -a 'htpasswd -b /etc/origin/master/htpasswd admin admin'
# ansible masters -m shell -a 'oc adm policy add-cluster-role-to-user cluster-admin admin'
*******oc adm policy add-role-to-user <role> <user> -n <project>*******指定项目中的用户权限
例:oc adm policy add-role-to-user view user -n e3plus
16.oc相关操作
oc get pod --all-namespaces -o wide //查看pod
oc rollout history DeploymentConfig/dc-name //查看dc历史版本
oc rollout history DeploymentConfig/dc-name --revision=5 //回滚到5版本
oc scale dc pod-name --replicas=3 -n namespace //设置副本数为3
oc delete pod pod-name -n namespace-name //重启pod
oc logs -f pod-name //查看pod log
oc adm top pods //查看pod资源状态
oc adm top node //查看节点资源状态
17.中台admin密码忘记修改
把system库中的sys_userinfo表的字段password改成bQlBCxh6kF6qc58Gjv9BXw==
另外在把create_time改成2019-11-13 00:00:00 翻译过来的密码就是 1qaz@wsx
18.测试环境rabbitmq连接信息
# rabbit
# spring.rabbitmq.host=172.16.61.168
# spring.rabbitmq.port=31569
# spring.rabbitmq.username=admin
# spring.rabbitmq.password=e3plus