Linux wc sort和uniq的用法

2016-12-13 本文已影响0人 Bloo_m

Sort
进行排序，而且可以依据不同的数据形态来排序

  [root@www ~]# sort [-fbMnrtuk] [file or stdin]
   选项与参数：
    -f:忽略大小写的差异，例如A与a视为编码相同
    -b:忽略最前面的空格符部分
    -M：以月份的名字来排序，例如JAN,DEC等等的排序方法
    -n:使用[纯数字]进行排序，（默认是以文字形态来排序的）
    -r:反向排序
    -u：就是uniq，相同的数据中，仅出现一行代表
    -t:分隔符，默认是以[tab]来分隔的
    -k:以那个区间(field)来进行排序
    

  对/etc/passwd的账号进行排序
  [root@www ~]# cat /etc/passwd | sort
  adm:x:3:4:adm:/var/adm:/sbin/nologin
  apache:x:48:48:Apache:/var/www:/sbin/nologin
  bin:x:1:1:bin:/bin:/sbin/nologin
  daemon:x:2:2:daemon:/sbin:/sbin/nologin
  sort 是默认以第一个数据来排序，而且默认是以字符串形式来排序,所以由字母 a 开始升序排序

  /etc/passwd 内容是以 : 来分隔的，我想以第三栏来排序，该如何
  [root@www ~]# cat /etc/passwd | sort -t ':' -k 3
  root:x:0:0:root:/root:/bin/bash
  uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
  operator:x:11:0:operator:/root:/sbin/nologin
  bin:x:1:1:bin:/bin:/sbin/nologin
  games:x:12:100:games:/usr/games:/sbin/nologin

  默认是以字符串来排序的，如果想要使用数字排序：
  cat /etc/passwd | sort -t ':' -k 3n
  root:x:0:0:root:/root:/bin/bash
  daemon:x:1:1:daemon:/usr/sbin:/bin/sh
  bin:x:2:2:bin:/bin:/bin/sh
  
  默认是升序排序，如果要倒序排序，如下
  cat /etc/passwd | sort -t ':' -k 3nr
  nobody:x:65534:65534:nobody:/nonexistent:/bin/sh
  ntp:x:106:113::/home/ntp:/bin/false
  messagebus:x:105:109::/var/run/dbus:/bin/false
  sshd:x:104:65534::/var/run/sshd:/usr/sbin/nologin

  如果要对/etc/passwd,先以第六个域的第2个字符到第4个字符进行正向排序，再基于第一个域进行反向排序。
  cat /etc/passwd |  sort -t':' -k 6.2,6.4 -k 1r      
  sync:x:4:65534:sync:/bin:/bin/sync
  proxy:x:13:13:proxy:/bin:/bin/sh
  bin:x:2:2:bin:/bin:/bin/sh
  sys:x:3:3:sys:/dev:/bin/sh

  查看/etc/passwd有多少个shell:对/etc/passwd的第七个域进行排序，然后去重:
  cat /etc/passwd |  sort -t':' -k 7 -u
  root:x:0:0:root:/root:/bin/bash
  syslog:x:101:102::/home/syslog:/bin/false
  daemon:x:1:1:daemon:/usr/sbin:/bin/sh
  sync:x:4:65534:sync:/bin:/bin/sync
  sshd:x:104:65534::/var/run/sshd:/usr/sbin/nologin

uniq

  uniq命令可以去除排序过的文件中的重复行，因此uniq经常和sort合用。
  也就是说，为了使uniq起作用，所有的重复行必须是相邻的。
  
  uniq语法：
  [root@www ~]#uniq [-icud]
  选项与参数:
   -i:忽略大小写字符的不同
   -c:显示每行的重复次数
   -u:只显示未曾重复过的行
   -d:仅显示重复的行

    统计文件里面有多少单词，多少行，多少字符。
    语法：
    [root@www ~]#wc [-lwm]
    选项与参数:
    -l:仅列出行数
    -m:字符数
    -w:仅列出多少个字(英文单词数)
    
  wc的命令比较简单，就不一一举例说明了。

Linux wc sort和uniq的用法

猜你喜欢

热点阅读