Linux常用命令之统计命令

本文详细介绍了Linux命令行中用于数据处理的三个重要工具:sort、uniq和wc。sort命令包括了各种排序选项,如忽略空格、数字排序和版本排序等;uniq主要用于去除重复行,提供了统计重复次数、跳过列比较等功能;wc则用于统计文件的字节数、行数和单词数。通过这些命令,用户能高效地管理和分析文本数据。

一,排序:sort

1. sort常用参数:

-b:忽略开头的空白字符

  • -f:将小写字母看做大写字母
  • -h:根据存储容量排序
  • -n:按数字排序
  • -o:将结果写入文件
  • -r:以相反的顺序来排序
  • -t:指定分隔符,默认为空格
  • -V:按照字母版本排序
  • -k:指定排序的关键字,与-t参数配合使用

2. 例子

  • 数字排序
    在这里插入图片描述
  • 把排序结果写入某个文件
    在这里插入图片描述
  • 指定按照 . 符号进行分隔,然后再指定某排按照大小进行排序

在这里插入图片描述

  • 按版本进行排序
    在这里插入图片描述

二,去除重复:uniq

1. uniq常用参数(只检查上下行是否重复):

  • -c:统计重复出现的次数
  • -d:所有临近的重复行只被打印一次。重复次数要大于等于2次
  • -D:所有临近的重复行全部打印
  • -f:跳过对前n列的比较(只能比较上下行的,如果中间有一列别的,然后再重复,是比较不出来的,所以一般我们先进行排序,然后再去重)
  • -s:跳过对前n个字符的比较(跟-f的区别是-f是跳过列,这个是针对字符)
  • -w:只对每行前n个字符进行比较

2. 例子

  • 原文件
    在这里插入图片描述

  • 统计重复出现的次数
    在这里插入图片描述

  • 只想通过ip地址比较,可以跳过前2列进行比较
    在这里插入图片描述

  • 以ip地址进行排序,把重复的排到一起,然后再对ip进行去重统计,然后再按照出现次数大小进行倒序排序
    在这里插入图片描述

  • 所以临近的只被打印一次
    在这里插入图片描述

  • 所有临近的重复行全部打印
    在这里插入图片描述

  • 跳过对前n个字符的比较
    在这里插入图片描述

  • 比较前2个字母连续出现的次数
    在这里插入图片描述

三,字符统计:wc

1. wc常用参数:

  • -c:统计字节数(chars)
  • -l:统计行数
  • -w:统计单词数(空格也算,然后每行都有一个分隔符,暂一个字符12+3+9)
  • -L:打印最长的长度

2. 例子

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值