欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Linux命令 - grep命令

程序员文章站 2024-02-23 17:22:22
...

Linux命令 - grep命令

  grep是Global Regular Expression Print的缩写,表示全局正则表达式版本,在Linux中 grep 命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来。它的使用权限是所有用户。
  grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到标准输出,不影响原文件内容。
  grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。
  查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设grep指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为“-”,则grep指令会从标准输入设备读取数据。
  经常与管道符“|”搭配使用,管道符表示将前一个命令的处理结果输出传递给后面的命令处理。

1.语法:

grep [选项] [文件或目录]...

2.功能:

  查找文件里符合条件的字符串。

3.参数:
-a或--text   不要忽略二进制的数据。
-A<显示列数>或--after-context=<显示列数>   除了显示符合范本样式的那一列之外,并显示该列之后的内容。
-b或--byte-offset   在显示符合范本样式的那一列之前,标示出该列第一个字符的位编号。
-B<显示列数>或--before-context=<显示列数>   除了显示符合范本样式的那一列之外,并显示该列之前的内容。
-c或--count   计算符合范本样式的列数。
-C<显示列数>或--context=<显示列数>或-<显示列数>   除了显示符合范本样式的那一列之外,并显示该列之前后的内容。
-d<进行动作>或--directories=<进行动作>   当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
-e<范本样式>或--regexp=<范本样式>   指定字符串做为查找文件内容的范本样式。
-E或--extended-regexp   将范本样式为延伸的普通表示法来使用。
-f<范本文件>或--file=<范本文件>   指定范本文件,其内容含有一个或多个范本样式,让grep查找符合范本条件的文件内容,格式为每列一个范本样式。
-F或--fixed-regexp   将范本样式视为固定字符串的列表。
-G或--basic-regexp   将范本样式视为普通的表示法来使用。
-h或--no-filename   在显示符合范本样式的那一列之前,不标示该列所属的文件名称。
-H或--with-filename   在显示符合范本样式的那一列之前,表示该列所属的文件名称。
-i或--ignore-case   忽略字符大小写的差别。
-l或--file-with-matches   列出文件内容符合指定的范本样式的文件名称。
-L或--files-without-match   列出文件内容不符合指定的范本样式的文件名称。
-n或--line-number   在显示符合范本样式的那一列之前,标示出该列的列数编号。
-q或--quiet或--silent   不显示任何信息。
-r或--recursive   此参数的效果和指定“-d recurse”参数相同。
-s或--no-messages   不显示错误信息。
-v或--revert-match   反转查找。
-w或--word-regexp   只显示全字符合的列。
-x或--line-regexp   只显示全列符合的列。
-y   此参数的效果和指定“-i”参数相同。
4.规则表达式:

grep的规则表达式:

^   锚定行的开始,如:'^grep'匹配所有以grep开头的行。    

$   锚定行的结束,如:'grep$'匹配所有以grep结尾的行。    

.   匹配一个非换行符的字符,如:'gr.p'匹配gr后接一个任意字符,然后是p。    

*   匹配零个或多个先前字符,如:'*grep'匹配所有一个或多个空格后紧跟grep的行。    

.*   一起用代表任意字符。   

[]   匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。    

[^]   匹配一个不在指定范围内的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一个字母开头,紧跟rep的行。    

\(..\)   标记匹配字符,如'\(love\)',love被标记为1。    

\<   锚定单词的开始,如:'\<grep'匹配包含以grep开头的单词的行。    

\>   锚定单词的结束,如'grep\>'匹配包含以grep结尾的单词的行。    

x\{m\}   重复字符x,m次,如:'0\{5\}'匹配包含5个o的行。    

x\{m,\}   重复字符x,至少m次,如:'o\{5,\}'匹配至少有5个o的行。    

x\{m,n\}   重复字符x,至少m次,不多于n次,如:'o\{5,10\}'匹配5--10个o的行。   

\w   匹配文字和数字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零个或多个文字或数字字符,然后是p。   

\W   \w的反置形式,匹配一个或多个非单词字符,如点号句号等。   

\b   单词锁定符,如: '\bgrep\b'只匹配grep。  

POSIX字符:

  为了在不同国家的字符编码中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字符类,如[:alnum:]是[A-Za-z0-9]的另一个写法。要把它们放到[]号内才能成为正则表达式,如[A- Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支持POSIX的字符类。

[:alnum:]   文字数字字符。   

[:alpha:]   文字字符。   

[:digit:]   数字字符。   

[:graph:]   非空字符(非空格、控制字符)。   

[:lower:]   小写字符。   

[:cntrl:]   控制字符。   

[:print:]   非空字符(包括空格)。   

[:punct:]   标点符号。   

[:space:]   所有空白字符(新行,空格,制表符)。   

[:upper:]   大写字符。   

[:xdigit:]   十六进制数字(0-9,a-f,A-F)。  
5.常用范例:

例一:查找指定进程

命令:ps -ef|grep server

  查找server的进程。除最后一条记录是查找出的进程;最后一条结果是grep进程本身,并非真正要找的进程。

[[email protected] ~]# ps -ef|grep server
root        3046    2888  0 10:50 ?        00:00:00 /usr/libexec/gnome-shell-calendar-server
root        3164    3138  0 10:50 ?        00:00:00 /usr/libexec/evolution-calendar-factory-subprocess --factory all --bus-name org.gnome.evolution.dataserver.Subprocess.Backend.Calendarx3138x2 --own-path /org/gnome/evolution/dataserver/Subprocess/Backend/Calendar/3138/2
root        3260    3193  0 10:50 ?        00:00:00 /usr/libexec/evolution-addressbook-factory-subprocess --factory all --bus-name org.gnome.evolution.dataserver.Subprocess.Backend.AddressBookx3193x2 --own-path /org/gnome/evolution/dataserver/Subprocess/Backend/AddressBook/3193/2
root        3447    2888  1 10:51 ?        00:00:01 /usr/libexec/gnome-terminal-server
root        3584    3452  0 10:53 pts/0    00:00:00 grep --color=auto server

例二:查找指定进程个数

命令: ps -ef|grep server -cps -ef|grep -c server

[[email protected] ~]# ps -ef|grep server -c
5
[[email protected] ~]# ps -ef|grep -c server
5

例三:从文件中读取关键词进行搜索

命令: cat log.txt | grep -f log1.txt

  输出log.txt文件中含有从log1.txt文件中读取出的关键词的内容行。

[[email protected] test]# cat log.txt
hnlinux
ubuntu
ubuntu linux
redhat
Redhat
linuxmint
[[email protected] test]# cat log1.txt 
linux
Redhat
[[email protected] test]# cat log.txt | grep -f log1.txt 
hnlinux
ubuntu linux
Redhat
linuxmint

例四:从文件中读取关键词进行搜索且显示行号

命令: cat log.txt | grep -nf log1.txt

  输出log.txt文件中含有从log1.txt文件中读取出的关键词的内容行,并显示每一行的行号。

[[email protected] test]# cat log.txt
hnlinux
ubuntu
ubuntu linux
redhat
Redhat
linuxmint
[[email protected] test]# cat log1.txt 
linux
Redhat
[[email protected] test]# cat log.txt | grep -nf log1.txt 
1:hnlinux
3:ubuntu linux
5:Redhat
6:linuxmint

例五:从文件中查找关键词

命令: grep 'linux' log.txt

[[email protected] test]# grep 'linux' log.txt 
hnlinux
ubuntu linux
linuxmint

例六:从多个文件中查找关键词

命令: grep 'linux' log.txt log1.txt

  多文件时,输出查询到的信息内容行时,会把文件的命名在行最前面输出并且加上":"作为标识符。

[[email protected] test]# grep 'linux' log.txt log1.txt 
log.txt:hnlinux
log.txt:ubuntu linux
log.txt:linuxmint
log1.txt:linux

例七:grep不显示本身进程

命令: ps -ef | grep server | grep -v "grep"

[[email protected] test]# ps -ef | grep server
root        3046    2888  0 10:50 ?        00:00:00 /usr/libexec/gnome-shell-calendar-server
root        3164    3138  0 10:50 ?        00:00:00 /usr/libexec/evolution-calendar-factory-subprocess --factory all --bus-name org.gnome.evolution.dataserver.Subprocess.Backend.Calendarx3138x2 --own-path /org/gnome/evolution/dataserver/Subprocess/Backend/Calendar/3138/2
root        3260    3193  0 10:50 ?        00:00:00 /usr/libexec/evolution-addressbook-factory-subprocess --factory all --bus-name org.gnome.evolution.dataserver.Subprocess.Backend.AddressBookx3193x2 --own-path /org/gnome/evolution/dataserver/Subprocess/Backend/AddressBook/3193/2
root        3447    2888  0 10:51 ?        00:00:02 /usr/libexec/gnome-terminal-server
root        4086    3452  0 11:21 pts/0    00:00:00 grep --color=auto server
[[email protected] test]# ps -ef | grep server | grep -v "grep"
root        3046    2888  0 10:50 ?        00:00:00 /usr/libexec/gnome-shell-calendar-server
root        3164    3138  0 10:50 ?        00:00:00 /usr/libexec/evolution-calendar-factory-subprocess --factory all --bus-name org.gnome.evolution.dataserver.Subprocess.Backend.Calendarx3138x2 --own-path /org/gnome/evolution/dataserver/Subprocess/Backend/Calendar/3138/2
root        3260    3193  0 10:50 ?        00:00:00 /usr/libexec/evolution-addressbook-factory-subprocess --factory all --bus-name org.gnome.evolution.dataserver.Subprocess.Backend.AddressBookx3193x2 --own-path /org/gnome/evolution/dataserver/Subprocess/Backend/AddressBook/3193/2
root        3447    2888  0 10:51 ?        00:00:02 /usr/libexec/gnome-terminal-server

例八:找出以u开头的行内容

命令: cat log.txt | grep ^u

[[email protected] test]# cat log
log1.txt  log2.txt  log3.txt  log.txt   
[[email protected] test]# cat log
log1.txt  log2.txt  log3.txt  log.txt   
[[email protected] test]# cat log.txt 
hnlinux
ubuntu
ubuntu linux
redhat
Redhat
linuxmint
[[email protected] test]# cat log.txt | grep ^u
ubuntu
ubuntu linux

例九:找出不是以u开头的行内容

命令: cat log.txt | grep ^[^u]cat log.txt | grep -v ^u

[[email protected] test]# cat log.txt 
hnlinux
ubuntu
ubuntu linux
redhat
Redhat
linuxmint
[[email protected] test]# cat log.txt | grep ^[^u]
hnlinux
redhat
Redhat
linuxmint

[[email protected] test]# cat log.txt | grep -v ^u
hnlinux
redhat
Redhat
linuxmint

例十:找出输以hat结尾的行内容

命令: cat log.txt | grep hat$

[[email protected] test]# cat log.txt 
hnlinux
ubuntu
ubuntu linux
redhat
Redhat
linuxmint
[[email protected] test]# cat log.txt | grep hat$
redhat
Redhat

例十一:包含ed或者nl字符的内容行

命令: cat log.txt | grep -E "ed|nl"

[[email protected] test]# cat log.txt 
hnlinux
ubuntu
ubuntu linux
redhat
Redhat
linuxmint
[[email protected] test]# cat log.txt | grep -E "ed|nl"
hnlinux
redhat
Redhat

例十二:当前目录下面以.txt 结尾的文件中的所有包含每个字符串至少有7个连续小写字符的字符串的行

命令: grep '[a-z]\{7\}' *.txt

[[email protected] test]# grep '[a-z]\{7\}' *.txt
log2.txt:Directory does not exist for read/write [F:\OracleServer\product\11.2.0\dbhome_1\log] [F:\OracleServer\product\11.2.0\dbhome_1\log\diag]
log2.txt:Directory does not exist for read/write [f:\oracleclient\log] []
log2.txt:Directory does not exist for read/write [F:\OracleServer\product\11.2.0\dbhome_1\log] [F:\OracleServer\product\11.2.0\dbhome_1\log\diag\clients]
log2.txt:Directory does not exist for read/write [F:\OracleServer\product\11.2.0\dbhome_1\log] [F:\OracleServer\product\11.2.0\dbhome_1\log\diag\clients]
log3.txt:Directory does not exist for read/write [F:\OracleServer\product\11.2.0\dbhome_1\log] [F:\OracleServer\product\11.2.0\dbhome_1\log\diag\clients]
log3.txt:Directory does not exist for read/write [F:\OracleServer\product\11.2.0\dbhome_1\log] [F:\OracleServer\product\11.2.0\dbhome_1\log\diag\clients]
log3.txt:Directory does not exist for read/write [F:\OracleServer\product\11.2.0\dbhome_1\log] [F:\OracleServer\product\11.2.0\dbhome_1\log\diag\clients]
log3.txt:Directory does not exist for read/write [F:\OracleServer\product\11.2.0\dbhome_1\log] [F:\OracleServer\product\11.2.0\dbhome_1\log\diag\clients]
log.txt:hnlinux
log.txt:linuxmint
相关标签: Linux