1. 将进程绑定到CPU
// A code block
taskset -pc 5-7 10889
绑定之后可以通过top命令来查看进程是否在指定的cpu上运行,执行top命令后按f键,然后按j键,然后回车,列表中就会显示进程号和运行的cpu编号
// Linux提供了cpu组,允许编组cpu并为其分配进程,可以设置进程独占,不允许其他进程使用,进一步提供性能,这种方式减少了系统其他部分的可用cpu。以下实例创建了一个独占组:
mkdir /dev/cpuset
mount -t cpuset cpuset /dev/cpuset
cd /dev/cpuset
mkdir prodset
echo 7-10 > cpus
echo 1 > cpu_exclusive
echo 0 > mems
echo 11111 > tasks
2. awk实现类似SQL中的group by
#!/bin/awk -f
BEGIN{
FS=" ";
}
{a[$1]+=$2;}
END
{
for (i in a)
{
print i,a[i];
}
}
3. 在命令行多次运行命令
for (( i=0; i<19; i++)) do echo "dd"; done
mycount=0; while (( $mycount < 10 )); do echo "ss" ; ((mycount = $mycount + 1)); done
while true; do echo "ss" ; done
4. 文件格式转换
iconv -f gbk -t utf-8 filename
5.rpm仓库地址
rpmfind:
http://rpmfind.net/linux/RPM/index.html
pkgs
https://pkgs.org/
fedora koji
https://koji.fedoraproject.org/koji/index
pbone
http://rpm.pbone.net/
源码
https://src.fedoraproject.org/projects/rpms/*
5.查看系统信息
cat /etc/os-release
lscpu
df -h
lsblk
free -G
ip addr
6.linux查看防火墙状态的方法:
iptables防火墙
-
基本操作
- 查看防火墙状态
service iptables status - 停止防火墙
service iptables stop - 启动防火墙
service iptables start - 重启防火墙
service iptables restart - 永久关闭防火墙
chkconfig iptables off - 永久关闭后重启
chkconfig iptables on
- 查看防火墙状态
-
开启80端口
- vim /etc/sysconfig/iptables
- 加入如下代码
-A INPUT -m state --state NEW -m tcp -p tcp --dport 80 -j ACCEPT - 保存退出后重启防火墙
service iptables restart
firewall防火墙
-
查看firewall服务状态
systemctl status firewalld
出现Active: active (running)切高亮显示则表示是启动状态。
出现Active: inactive (dead)灰色表示停止,看单词也行。 -
查看firewall的状态
firewall-cmd --state -
开启、重启、关闭、firewalld.service服务
service firewalld start
service firewalld restart
service firewalld stop -
查看防火墙规则
firewall-cmd --list-all -
查询、开放、关闭端口
- 查询端口是否开放
firewall-cmd --query-port=8080/tcp - 开放80端口
firewall-cmd --permanent --add-port=80/tcp - 移除端口
firewall-cmd --permanent --remove-port=8080/tcp - 重启防火墙(修改配置后要重启防火墙)
firewall-cmd --reload
- 查询端口是否开放
-
参数解释
- firwall-cmd:是Linux提供的操作firewall的一个工具;
- permanent:表示设置为持久;
- add-port:标识添加的端口;
解决网络time_wait问题
- 使用命令:netstat -an | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}’ 查看连接状态统计
- 使用命令:vim /etc/sysctl.conf
- 编辑文件,加入以下内容:
- net.ipv4.tcp_syncookies = 1 (某些情况下该参数已启用)
- net.ipv4.tcp_tw_reuse = 1
- net.ipv4.tcp_tw_recycle = 1
- net.ipv4.tcp_fin_timeout = 30
- 然后执行/sbin/sysctl -p让参数生效。
- net.ipv4.tcp_syncookies = 1表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;
- net.ipv4.tcp_tw_reuse = 1表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;
- net.ipv4.tcp_tw_recycle = 1表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。
- net.ipv4.tcp_fin_timeout 修改系統默认的TIMEOUT时间
查看进程堆栈信息
- 第一种:pstack 进程ID
- 第二种:使用gdb 然后attach 进程ID,然后再使用命令 thread apply all bt
查看堆栈:gdb -quiet -batch -ex=‘thread apply all bt’ -p pid
查看运行位置:gdb -quiet -batch -ex=‘thread apply all x $pc’ -p pid - 第三种:strace -f -p pid 该方法和pstack类似
- 第四中:gcore pid ,输出core文件,gdb cmd corefile
Linux 常见异常分析
-
1、常用的 Load 分析方法
-
CPU高、Load高
通过 命令查找占用CPU最高的进程PID;
通过查找占用CPU最高的线程TID;
对于程序,使用打印线程堆栈信息;
通过打印出最消耗CPU线程的十六进制;
-
CPU低、Load高
产生的原因一句话总结就是:等待磁盘I/O完成的进程过多,导致进程队列长度过大,但是CPU运行的进程却很少,这样就体现到负载过大了,cpu使用率低。
通过命令查看CPU等待IO时间,即;
通过查看磁盘IO情况;(安装命令 )
通过查看网络IO情况;
通过如下命令查找占用IO的程序;
-
-
2、CPU高、Load高情况分析
使用 查看系统纬度的 CPU 负载;
使用 查看进程纬度的 CPU 负载;
-
2.1 使用 vmstat 查看系统纬度的 CPU 负载
可以通过 vmstat 从系统维度查看 CPU 资源的使用情况
格式: 表示结果一秒刷新一次
返回结果中的主要数据列说明:
r:表示系统中 CPU 等待处理的线程。由于 CPU 每次只能处理一个线程,所以,该数值越大,通常表示系统运行越慢。
b:表示阻塞的进程,这个不多说,进程阻塞,大家懂的。
us:用户CPU时间,我曾经在一个做加密解密很频繁的服务器上,可以看到us接近100,r运行队列达到80(机器在做压力测试,性能表现不佳)。
sy:系统CPU时间,如果太高,表示系统调用时间长,例如是IO操作频繁。
wa:IO 等待消耗的 CPU 时间百分比。该值较高时,说明 IO 等待比较严重,这可能磁盘大量作随机访问造成的,也可能是磁盘性能出现了瓶颈。
id:处于空闲状态的 CPU 时间百分比。如果该值持续为 0,同时 sy 是 us 的两倍,则通常说明系统则面临着 CPU 资源的短缺。
常见问题及解决方法:
如果 r 经常大于4,且id经常少于40,表示cpu的负荷很重。
如果pi,po长期不等于0,表示内存不足。
如果disk经常不等于0,且在b中的队列大于3,表示io性能不好。
-
2.2 使用 top 查看进程纬度的 CPU 负载
可以通过 top 从进程纬度来查看其 CPU、内存等资源的使用情况。
默认界面上第三行会显示当前 CPU 资源的总体使用情况,下方会显示各个进程的资源占用情况。
可以直接在界面输入大小字母 P,来使监控结果按 CPU 使用率倒序排列,进而定位系统中占用 CPU 较高的进程。最后,根据系统日志和程序自身相关日志,对相应进程做进一步排查分析,以判断其占用过高 CPU 的原因。
-
-
3、CPU低、Load高
问题描述 Linux 系统没有业务程序运行,通过 top 观察,类似如下图所示,CPU 很空闲,但是 load average 却非常高: 问题分析 CPU低而负载高也就是说等待磁盘I/O完成的进程过多,就会导致队列长度过大,这样就体现到负载过大了,但实际是此时CPU被分配去执行别的任务或空闲,具体场景有如下几种: 场景一:磁盘读写请求过多就会导致大量I/O等待 上面说过,cpu的工作效率要高于磁盘,而进程在cpu上面运行需要访问磁盘文件,这个时候cpu会向内核发起调用文件的请求,让内核去磁盘取文件,这个时候会切换到其他进程或者空闲,这个任务就会转换为不可中断睡眠状态。当这种读写请求过多就会导致不可中断睡眠状态的进程过多,从而导致负载高,cpu低的情况。 场景二:MySQL中存在没有索引的语句或存在死锁等情况 我们都知道MySQL的数据是存储在硬盘中,如果需要进行sql查询,需要先把数据从磁盘加载到内存中。当在数据特别大的时候,如果执行的sql语句没有索引,就会造成扫描表的行数过大导致I/O阻塞,或者是语句中存在死锁,也会造成I/O阻塞,从而导致不可中断睡眠进程过多,导致负载过大。具体解决方法可以在MySQL中运行show full processlist命令查看线程等待情况,把其中的语句拿出来进行优化。 场景三:外接硬盘故障,常见有挂了NFS,但是NFS server故障 比如我们的系统挂载了外接硬盘如NFS共享存储,经常会有大量的读写请求去访问NFS存储的文件,如果这个时候NFS Server故障,那么就会导致进程读写请求一直获取不到资源,从而进程一直是不可中断状态,造成负载很高。 处理办法 load average 是对 CPU 负载的评估,其值越高,说明其任务队列越长,处于等待执行的任务越多。 出现此种情况时,可能是由于僵死进程导致的。可以通过指令ps -axjf查看是否存在 D 状态进程。 D 状态是指不可中断的睡眠状态。该状态的进程无法被 kill,也无法自行退出。只能通过恢复其依赖的资源或者重启系统来解决。 等待 I/O 的进程通过处于 uninterruptible sleep 或 D 状态;通过给出这些信息我们就可以简单的查找出处在wait状态的进程。