欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

正则表达式 ------ grep与egrep

程序员文章站 2022-05-13 23:50:29
...

一、grep命令

  • -n: 表示显示行号
  • -i : 表示不区分大小写刷选
  • -v : 表示方向查找

(1)查找特定的字符

grep -n 'the' abc.txt  //查找有the的行,并显示出行号
grep -in ‘the’ abc.txt  //不区分大小写查找有the的行,并显示行号

如果是想查找不包含the的行,-vn选项即可

grep -vn ‘the’ abc.txt  //查找不包括the的行,并显示出行号

(2)中括号 [ ] 查找集合字符

例如:当我们需要查找两个字符 “aboyz” 和 “abiyz” 这两个字符时,其中ab和yz都是相同的,可以利用 [ ]来匹配字符,[ ]中不论有几个字符,都仅代表一个字符,
正则表达式 ------ grep与egrep
正则表达式 ------ grep与egrep
正则表达式 ------ grep与egrep
注意:“^”符号在元字符集合“[]”符号内外的作用是不一样的,在“[]”符号内表示反向选择,在“[]”符号外则代表定位行首。
正则表达式 ------ grep与egrep
(3)查找任意一个字符 “.” 与重复字符 “*”

代表的是重复零个或多个前面的单字符,比如“o*”表示拥有零个(即为空字符)或大于等于一个“o”的字符;如果是“oo*”, 则第一个 o 必须存在,第二个o可以是零个或多个。
正则表达式 ------ grep与egrep
(4)查找连续字符范围 { }

因为“{ }”在 Shell 中具有特殊意义,所以在使用“{}”字符时,需要利用转义字符“\”,将“{ }”字符转换成普通字符

例1:查找有两个o 的字符

grep -n 'o\{2\}' abc.txt   

例2:查询以 w 开头以 d 结尾,中间包含 2~5 个 o 的字符串

grep -n 'wo\{2,5\}d' abc.txt

例3:查询以 w 开头以 d 结尾,中间包含 2 以上 o 的字符串

grep -n 'wo\{2,\}d' abc.txt

二、元字符总结:

元字符 作用
^ 匹配输入字符串的开始位置。除非在方括号表达式中使用,表示不包含该字符集合。要匹配“^”字符本身,请使用“^”
$ 匹配输入字符串的结尾
. 匹配除“\r\n”之外的任何单个字符
\ 将下一个字符标记为特殊字符、原义字符、向后引用、八进制转义符。
* 匹配前面的子表达式零次或多次
[ ] 字符集合,匹配所包含的任意一个字符
[^] 赋值字符集合,匹配未包含的一个任意字符
[n1-n2] 字符范围,匹配指定范围内的任意一个字符。
{n} n 是一个非负整数,匹配确定的 n 次。
{n,} n 是一个非负整数,至少匹配 n 次。
{n,m} m 和n 均为非负整数,其中 n<=m,最少匹配 n 次且最多匹配 m 次

三、egrep 命令

grep 命令仅支持基础正则表达式,如果使用扩展正则表达式,需要使用 egrep 。egrep 命令与 grep 命令的用法基本相似。egrep 命令是一个搜索文件获得模式,使用该命令可以搜索文件中的任意字符串和符号,也可以搜索一个或多个文件的字符串,一个提示符可以是单个字符、一个字符串、一个字或一个句子

常见的元字符

符号 作用
+ 重复一个或者一个以上的前一个字符
? 零个或者一个的前一个字符
( ) 查找“组”字符串
( )+ 辨别多个重复的组
| 使用或者(or)的方式找出多个字符