欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

Linux基础命令---显示文本grep

程序员文章站 2022-07-02 19:02:37
grep 按照指定的模式,在文件中搜索匹配的行,将结果显示在标准输出。另外还有两个指令egrep相当于grep –E,fgrep相当于grep -F。如果没有给出文件名,那么从标准输入读取。 此命令的适用范围:RedHat、RHEL、Ubuntu、CentOS、SUSE、openSUSE、Fedor ......

grep

      按照指定的模式,在文件中搜索匹配的行,将结果显示在标准输出。另外还有两个指令egrep相当于grep –e,fgrep相当于grep -f。如果没有给出文件名,那么从标准输入读取。

     此命令的适用范围:redhat、rhel、ubuntu、centos、suse、opensuse、fedora。

 

1、语法

     grep [选项]  pattern files

     grep [options]  [-e pattern | -f file]  [file...]

 

2、选项列表

选项

说明

-v | --version

显示命令版本信息

--help

显示帮助文档

匹配选择

 

-e | --extended-regexp

使用扩展规则表达式解释匹配模式

-f | --fixed-strings

将匹配模式看做固定字符串

-g | --basic-regexp

使用基本规则表达式解释匹配模式

-p | --perl-regexp

使用perl表达式解释匹配模式

文件和目录选择控制

 

-a | --text

忽略二进制数据

--binary-files=type

如果文件的前几个字节表示该文件包含二进制数据,则假定该文件类型是type。默认情况下,type为二进制,grep通常输出一行消息表示二进制文件匹配,如果没有匹配则不输出消息。如果类型不匹配,grep假定二进制文件不匹配;这相当于-i选项。如果type是文本,grep会像处理文本一样处理二进制文件;这相当于-a选项。警告:“grep-binary-files=text”可能会输出二进制垃圾,如果输出是终端,并且终端驱动程序将其中的一些解释为命令,则会产生严重的副作用。

-d action | --devices=action

如果输入文件是一个设备文件,那么用指定的action处理。read,像普通文件一样读取设备,skip,忽略设备

-d action | --directories=action

如果查找的是目录文件,那么使用指定的操作处理。read,像普通文件一样读取目录;skip,忽略目录;recursive,递归当时读取子目录下文件。

--exclude=per

忽略文件名匹配per的文件       

--exclude-from=file

跳过其基本名称与从file中读取的任何文件名全局匹配的文件。

--exclude-dir=dir

从递归搜索中排除匹配模式dir的目录

-i

处理二进制文件,就像它不包含匹配的数据一样;等价于“--binary-files=without-match”

--include=glob

只搜索其基本名称与glob匹配的文件

-r | -r | --recursive

递归方式读取目录下所有文件

行数控制

 

-a num | --after-context=num

显示匹配行以及之后指定的行数

-b num | --before-context=num

显示匹配行以及之前指定的行数

-c num | -num | --context=num

显示匹配行以及之前和之后的指定行数

输出行控制

 

-b | --byte-offset

在显示匹配的行之前,打印该行第一个字符的偏移位置

-h | --with-filename

为每个匹配的行显示文件名,如果有多个文件的话,这是默认操作

-h | --no-filename

显示匹配的行,但是不显示文件名。如果搜索一个文件时,这是默认操作

-n | --line-number

显示匹配的行之前,显示行号

-t | --initial-tab

确保实际行内容的第一个字符位于制表符停止上,使制表符的对齐看起来正常。

-u | --unix-byte-offsets

报告unix样式的字节偏移量。此开关使grep报告字节偏移量,就像文件是unix样式的文本文件一样

-z | --null

输出一个零字节(ascii null字符),而不是通常跟随文件名的字符。例如,“grep –lz”在每个文件名之后输出一个零字节,而不是通常的换行符。

输出控制

 

-c | --count

统计符合匹配的行数

--color[=when] |  --colour[=when]

用转义序列包围匹配(非空)字符串、匹配行、上下文行、文件名、行号、字节偏移量和分隔符(用于字段和上下文行组),以便在终端上显示它们的颜色。颜色由环境变量grep_colors定义。仍然支持不推荐的环境变量grep_color,但它的设置没有优先级。when的有效值是never,always,auto。

-l | --files-without-match

禁止正常输出;而是打印通常不会输出的每个输入文件的名称。扫描将在第一次匹配的时候停止。

-l

显示内容符合指定匹配模式的文件名

-m num  |  --max-count=num

在匹配num行之后,停止搜索

-o | --only-matching

只显示匹配行的匹配字符

-q | --quite

静默模式,搜索完成之后返回0

-s | --no-messages

不显示文件不存在和文件不可读的错误信息

模式控制

 

-e parttern  |  --regexp=pattern

设置匹配模式

-f file  | --file=file

将给定的文件内容作为匹配模式

-i  |  --ignore-case

忽略大小写

-v | --invert-match

显示不符合匹配模式的行

-w | --word-regexp

显示整个字都匹配的行

-x | --line-regexp

显示整行都匹配的行

其他选项

 

--line-buffered

对输出使用行缓冲。这会导致性能损失。

--mmap

如果可能,使用mmap(2)系统调用来读取输入,而不是默认的read(2)系统调用。在某些情况下,mmap会产生更好的性能。但是,-mmap可能导致未定义的行为(包括核心转储),如果一个输入文件在grep运行时收缩,或者如果发生i/o错误。

-u | --binary

将文件视为二进制文件。

-z | --null-data

将输入视为一组行,每一行以零字节(ascii nul字符)结尾,而不是换行符。

 

3、环境变量

     grep的行为受到以下环境变量的影响。

     grep_options,此变量指定放置在任何显式选项前面的默认选项。选项规范由空格分隔。反斜杠转义下一个字符,因此它可以指定包含空格或反斜杠的选项。例如,如果grep_options是’--binary-files=without-match --directories=skip’,那么grep执行的时候就假设已经有了这两个选项。

     grep_color,此变量指定用于突出显示匹配(非空)文本的颜色。

     grep_colors,指定用于突出显示输出的各个部分的颜色和其他属性。它的值是一个以冒号分隔的功能列表,默认为ms=01;31:mc=01;31:sl=:cx=:fn=35:ln=32:bn=32:se=36,省略了rv和ne布尔功能(即false)。支持的功能如下所示。

          sl=,用于整个选定行的sgr子字符串(即-v命令行选项省略时的匹配行,或指定-v时不匹配的行)。但是,如果指定了布尔rv功能和-v命令行选项,则它将应用于上下文匹配行。默认值为空(即终端的默认颜色对)。

          cx=,用于整个上下文行的sgr子字符串(即省略-v命令行选项时的非匹配行,或指定-v时的匹配行)。但是,如果指定了布尔rv功能和-v命令行选项,则它将适用于选定的非匹配行。默认值为空(即终端的默认颜色对)。

          rv,当指定-v命令行选项时,逆转(掉期)“sl=”和“cx=”功能的布尔值。缺省值为false(即省略了功能)。

          mt=01;31,用于匹配任何行中的非空文本的sgr子字符串。(这仅在省略-v命令行选项时使用。)当启动时,sl=(或cx=)能力的效果保持活跃。默认值是当前行背景上的粗体红色文本前景。

          ms=01;31,用于匹配选定行中的非空文本的sgr子字符串。(这仅在省略-v命令行选项时使用。)当启动时,sl=(或cx=)能力的效果保持活跃。默认值是当前行背景上的粗体红色文本前景。

          mc=01;31,用于匹配上下文行中的非空文本的sgr子字符串。(这仅在省略-v命令行选项时使用。)当启动时,sl=(或cx=)能力的效果保持活跃。默认值是当前行背景上的粗体红色文本前景。

          fn=35,用于任何内容行前缀的文件名的sgr子字符串。默认值是终端默认背景上的洋红色文本前景。

          ln=32,任何内容行前缀的行号的sgr子字符串。默认值是终端默认背景上的绿色文本前景。

          bn=32,用于任何内容行前缀的字节偏移的sgr子字符串。默认值是终端默认背景上的绿色文本前景。

          se=36,当指定了非零上下文(--),sgr子字符串用于在选定的行字段(:)、上下文行字段之间(-)和相邻行组之间插入分隔符。默认值是终端默认背景上的青色文本前景。

          ne,布尔值,该值防止在每次彩色项结束时使用擦除入行(el)对右(\33[k]清除到行尾的值。这是在不支持el的终端上需要的。对于没有应用back_color_erase(bce)布尔终止功能的终端、所选择的高亮颜色不影响背景、或者当el太慢或导致过多闪烁时,它在其他情况下是有用的。默认值为false(即省略功能)

     lc_all, lc_collate, lang,这些变量指定lc_collate类别的区域设置,该类别确定用于解释范围表达式(如[a-z])的排序序列。

     lc_all, lc_ctype, lang,这些变量指定lc_ctype类别的区域设置,它决定字符的类型,例如,哪些字符是空格。

     lc_all, lc_messages, lang,这些变量指定lc_messages类别的区域设置,它确定grep用于消息的语言。默认的c语言环境使用美式英语消息。

     posixly_correct,如果设置,grep的行为与posix.2所要求的一样;否则,grep的行为更像其他gnu程序。posix.2要求必须将文件名后面的选项视为文件名;默认情况下,这些选项被排到操作数列表的前面,并被视为选项。此外,posix.2还要求将未被承认的选项诊断为“非法”,但由于它们并不真正违反法律,默认情况是将它们诊断为“无效”。posixly_rider还禁用_n_gnu_nooption_argv_langs_,如下所述。

     _n_gnu_nonoption_argv_flags_,(这里n是grep的数字进程id。)如果此环境变量值的ith字符为1,则不要将grep的ith操作数视为选项,即使它似乎是选项之一。shell可以为其运行的每个命令在环境中放置此变量,指定哪些操作数是文件名通配符展开的结果,因此不应被视为选项。此行为仅在gnu c库中可用,且仅在未设置posixly_rider时才可用。

 

4、退出码

     通常,如果找到选定的行,则退出状态为0,否则为1。但是,如果发生错误,退出状态为2,除非使用-q、--quite、--slient选项,并找到选定的行。但是,请注意,对于grep、cmp和diff等程序,posix只要求在出现错误时的退出状态大于1;因此,出于可移植性的考虑,建议使用对此一般条件进行测试的逻辑,而不是与2严格相等的逻辑。

 

5、实例

     1)显示文件中以2开头的行

[root@localhost weijie]# cat 2.c

123

23

212

[root@localhost weijie]# grep ^2 2.c         //显示以2开头的行

23

212

     2)显示不包含23的行 

[root@localhost weijie]# grep -v 23 2.c

212

     3)显示整个字都匹配的行 

[root@localhost weijie]# grep -w 23 2.c

23