知识收藏

基于sort和uniq的集合操作(简单明了)

2022-09-23  本文已影响0人  曹草BioInfo

sort:用于将文本文件内容加以排序

uniq:删除文件中重复的行,得到文件中唯一的行

交集

sort a.txt b.txt | uniq -d

(用sort将a.txt b.txt文件进行排序,uniq使得两个文件中的行唯一,使用-d输出两个文件中次数大于1的内容,即是得到交集)

并集

sort a.txt b.txt | uniq 

(将a.txt b.txt文件进行排序,uniq使得两个文件中的内容为唯一的,即可得到两个文件的并集)

差集

a.txt-b.txt:

sort -n -k2 a.txt b.txt b.txt | uniq -u

(将两个文件排序,最后输出a.txt b.txt b.txt文件中只出现过一次的内容,因为有两个b.txt所以只会输出只在a.txt出现过一次的内容,即是a.txt-b.txt差集)

b.txt-a.txt:

sort b.txt a.txt a.txt | uniq -u

(同a.txt-b.txt:)

uniq参数说明:

-d 仅显示重复出现的行列;
-u 仅显示出一次的行列。

上一篇下一篇

猜你喜欢

热点阅读