linux文本处理命令(sort、uniq、wc)
程序员文章站
2022-05-10 20:37:44
...
sort:排序,可以根据不同的数据类型来排序
sort [参数] 文件名
-f 忽略大小写
-b 忽略最前面的空格
-n 使用“纯数字”来排序
-r 反序
-t 分隔符,默认使用[Tab]键来分割
-k 以第几个区间来排序,常和-t连用
sort 是默认以第一个数据来排序,而且默认是以字符串形式来排序,所以由字母 a 开始升序排序。
例:按/etc/passwd文件的第四个字段(每个字段以“:”分隔)的数字大小排序,将排序结果输出到屏幕上。
[aaa@qq.com/etc]$ sort /etc/passwd -n -t ‘:’ -k 4
或者n与k结合
[aaa@qq.com/etc]$ sort /etc/passwd -t ‘:’ -k 4n
例:查看/etc/passwd有多少个shell:对/etc/passwd的第七个域进行排序,然后去重 (-u):
[aaa@qq.com/etc]$ sort /etc/passwd -t ‘:’ -k 7 -u
uniq : 将重复的行删除,只显示一个,一般与sort结合使用
uniq [参数]
-i 忽略大小写
-c 进行计数
例:
语句:cat testfile | sort |uniq
结果:排序文件,默认是去重
wc : 统计字符,行数,字符数
wc [参数]
-l 仅列出行
-w 列出多少字(英文单字)
-m 多少字符
-c或 只显示Bytes数。
第一个是文件行号
第二个是单词数
第三个是字节数