Linux_learning文本处理(grep, sed和awk等)linux&github

Linux grep命令

2019-05-09  本文已影响8人  Y大宽

1 grep用法

grep [options] regex [file...]

2 grep参数

选项描述:
-i 忽略大小写。不会区分大小写字符。也可用--ignore-case 来指定。
-v 不匹配。通常,grep 程序会打印包含匹配项的文本行。这个选项导致 grep 程序 只会不包含匹配项的文本行。也可用--invert-match 来指定。
-c 打印匹配的数量(或者是不匹配的数目,若指定了-v 选项),而不是文本行本身。 也可用--count 选项来指定。
-l 打印包含匹配项的文件名,而不是文本行本身,也可用--files-with-matches 选项来指定。
-L 相似于-l 选项,但是只是打印不包含匹配项的文件名。也可用--files-without-match 来指定。
-n 在每个匹配行之前打印出其位于文件中的相应行号。也可用--line-number 选项来指定。
-h 应用于多文件搜索,不输出文件名。也可用--no-filename 选项来指定。

3 正则表达式

正则表达式的元字符包括
^ $ . [ ] { } - ? * + ( ) | \

3.1 任意字符.

$ cat /usr/share/dict/words> mywords.txt
$ grep Kell. mywords.txt
Keller
Kelley
Kelley's
Kelli
Kelli's
Kellie
Kellie's
Kellogg
Kelly

输出文件中包含'Kell'的文件。.为任意字符,所以合计5个字符,其中第五个字符为任意字符。

3.2 锚点

^ 起始点
$终止点

$ grep '^keyb' mywords.txt
keyboard
keyboard's
keyboarded
keyboarder
keyboarder's
keyboarders
keyboarding
keyboards
$ grep '^kid$' mywords.txt
kid

下面这个可以查找特定单词

$ grep '^.ite$' mywords.txt
bite
cite
kite
lite
mite
nite
rite
site

注意^$匹配空行,这个命令很有用,可以删除空行

3.3 中括号表达式和字符类

中括号表达式,能够指定 一个字符集合(包含在不加中括号的情况下会被解释为元字符的字符)来被匹配。

$ grep 'h[ae]lly' mywords.txt
Shelly
Shelly's
lethally

只要包含hally或helly即可匹配到。

3.4否定

正则表达式中的第一个字符是插入字符^,则剩余字符被看作是被排除的字符。

grep '[^kb]nike' words
moniker
moniker's
monikers

可见,得到的是包含‘nike’,但前面的字符是除‘k’和‘b’之外的任意字符。中括号内,^不是锚定作用了,是‘非’的意思。

3.5传统的字符区域

比如,想找出以字母abcdefg开头,ike结尾的单词

$ grep '^[a-i]ike' words
bike
bike's
biked
biker
biker's
bikers
bikes
dike
dike's
diked
dikes
hike
hike's
hiked
hiker
hiker's
hikers
hikes
$ grep '^[A-Ka-i]elly' words
Kelly
belly
belly's
bellyache
bellyache's
bellyached
bellyaches
bellyaching
bellybutton
bellybutton's
bellybuttons
bellyful
bellyful's
bellyfuls
bellying
上一篇下一篇

猜你喜欢

热点阅读