一,排序:sort
1. sort常用参数:
-b:忽略开头的空白字符
- -f:将小写字母看做大写字母
- -h:根据存储容量排序
- -n:按数字排序
- -o:将结果写入文件
- -r:以相反的顺序来排序
- -t:指定分隔符,默认为空格
- -V:按照字母版本排序
- -k:指定排序的关键字,与-t参数配合使用
2. 例子
- 数字排序
- 把排序结果写入某个文件
- 指定按照 . 符号进行分隔,然后再指定某排按照大小进行排序
- 按版本进行排序
二,去除重复:uniq
1. uniq常用参数(只检查上下行是否重复):
- -c:统计重复出现的次数
- -d:所有临近的重复行只被打印一次。重复次数要大于等于2次
- -D:所有临近的重复行全部打印
- -f:跳过对前n列的比较(只能比较上下行的,如果中间有一列别的,然后再重复,是比较不出来的,所以一般我们先进行排序,然后再去重)
- -s:跳过对前n个字符的比较(跟-f的区别是-f是跳过列,这个是针对字符)
- -w:只对每行前n个字符进行比较
2. 例子
-
原文件
-
统计重复出现的次数
-
只想通过ip地址比较,可以跳过前2列进行比较
-
以ip地址进行排序,把重复的排到一起,然后再对ip进行去重统计,然后再按照出现次数大小进行倒序排序
-
所以临近的只被打印一次
-
所有临近的重复行全部打印
-
跳过对前n个字符的比较
-
比较前2个字母连续出现的次数
三,字符统计:wc
1. wc常用参数:
- -c:统计字节数(chars)
- -l:统计行数
- -w:统计单词数(空格也算,然后每行都有一个分隔符,暂一个字符12+3+9)
- -L:打印最长的长度