欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

正则表达式的多行模式与单行模式图文分析

程序员文章站 2022-06-23 11:32:34
在expresso中,测试“多行模式” 测试一 注意:这里样例文本中3eeeee后面没有回车,光标就在e的后面。匹配的结果是3eeeee,如上图的search re...

在expresso中,测试“多行模式”

测试一

正则表达式的多行模式与单行模式图文分析

注意:这里样例文本中3eeeee后面没有回车,光标就在e的后面。匹配的结果是3eeeee,如上图的search results区中所示。

为什么这里不能匹配1abcde和2abc?

开启多行模式

^ 可以匹配字符串开头(字符串的开始位置),也可以匹配行的开头(即换行符\n之后的位置)
$ 可以匹配字符串结尾(字符串的结束位置), 也可以匹配行的结尾(即换行符\n之前的位置)

关闭多行模式

^ 只能匹配字符串开头
$ 只能匹配字符串结尾

知识点:\r为回车符,\n 为换行符。在windows中,我们平常说的换行,实质上是先回车,后换行;下面有更详细解说。

正则表达式的多行模式与单行模式图文分析

如上图所示:\r 匹配 [cr]、\n 匹配[lf]   <——  cr为回车  lf为换行 
字符串多个段落,比如
ab
cd
e
在windows操作系统中其实是:ab[cr][lf]cd[cr][lf]e

在windows中,文本中的回车换行储存为: 0d 0a。也就是说,先储存的是“回车\r”<cr>,再储存的是“换行\n”<lf>
cr用符号'\r'表示, ascii代码是13, 十六进制为0x0d;
lf用符号'\n'表示, ascii代码是10, 十六进制为0x0a;

正则表达式:(?m)^(\d\w+)(\s*)$

样例文本

正则表达式的多行模式与单行模式图文分析

匹配结果

正则表达式的多行模式与单行模式图文分析

在expresso、php中,启用多行模式,"$" 匹配字符串结束位置或者 "\n" 之前的位置。

单行模式

开启单行模式: . 可以匹配任意字符(包括换行符)
关闭单行模式: . 只有匹配 非换行 的其它任意字符(.可匹配\r,即除了不匹配\n外的所有字符。)

多行模式 影响 ^ 和 $ 的匹配
单行模式 影响 . 的匹配

多行模式中必定包含 ^ 或 $ 或同时包含,否则即使加了 m,也没有任何意义

单行模式和多行模式是八杆子打不着的两个概念,只是因为正则发展的历史原因,造就了这样两个ms互斥的概念
单行模式影响的是小数点“.”的匹配范围
多行模式影响的是“^”和“$”的匹配范围

至于后面几个概念,全局匹配,多行模式和贪婪模式之间也没有什么必然联系

全局匹配关闭,只匹配首次成功匹配项,全局匹配开启,匹配所有成功匹配项
全局模式是一些脚本语言中才有的概念
在进行匹配时,关闭全局模式,类似于.net中的match方法,开启全局模式,类似于.net中的matches方法
在进行替换时,关闭全局模式,类似于java中的replacefirst,开启全局模式,类似于java中的replaceall

(在进行匹配时,关闭全局模式,类似于php中的preg_ match函数;开启全局模式,类似于php中的preg_ match_ all函数)