正则表达式的多行模式与单行模式图文分析
在expresso中,测试“多行模式”
测试一
注意:这里样例文本中3eeeee后面没有回车,光标就在e的后面。匹配的结果是3eeeee,如上图的search results区中所示。
为什么这里不能匹配1abcde和2abc?
开启多行模式
^ 可以匹配字符串开头(字符串的开始位置),也可以匹配行的开头(即换行符\n之后的位置)
$ 可以匹配字符串结尾(字符串的结束位置), 也可以匹配行的结尾(即换行符\n之前的位置)
关闭多行模式
^ 只能匹配字符串开头
$ 只能匹配字符串结尾
知识点:\r为回车符,\n 为换行符。在windows中,我们平常说的换行,实质上是先回车,后换行;下面有更详细解说。
如上图所示:\r 匹配 [cr]、\n 匹配[lf] <—— cr为回车 lf为换行
字符串多个段落,比如
ab
cd
e
在windows操作系统中其实是:ab[cr][lf]cd[cr][lf]e
在windows中,文本中的回车换行储存为: 0d 0a。也就是说,先储存的是“回车\r”<cr>,再储存的是“换行\n”<lf>
cr用符号'\r'表示, ascii代码是13, 十六进制为0x0d;
lf用符号'\n'表示, ascii代码是10, 十六进制为0x0a;
正则表达式:(?m)^(\d\w+)(\s*)$
样例文本
匹配结果
在expresso、php中,启用多行模式,"$" 匹配字符串结束位置或者 "\n" 之前的位置。
单行模式
开启单行模式: . 可以匹配任意字符(包括换行符)
关闭单行模式: . 只有匹配 非换行 的其它任意字符(.可匹配\r,即除了不匹配\n外的所有字符。)
多行模式 影响 ^ 和 $ 的匹配
单行模式 影响 . 的匹配
多行模式中必定包含 ^ 或 $ 或同时包含,否则即使加了 m,也没有任何意义
单行模式和多行模式是八杆子打不着的两个概念,只是因为正则发展的历史原因,造就了这样两个ms互斥的概念
单行模式影响的是小数点“.”的匹配范围
多行模式影响的是“^”和“$”的匹配范围
至于后面几个概念,全局匹配,多行模式和贪婪模式之间也没有什么必然联系
全局匹配关闭,只匹配首次成功匹配项,全局匹配开启,匹配所有成功匹配项
全局模式是一些脚本语言中才有的概念
在进行匹配时,关闭全局模式,类似于.net中的match方法,开启全局模式,类似于.net中的matches方法
在进行替换时,关闭全局模式,类似于java中的replacefirst,开启全局模式,类似于java中的replaceall
(在进行匹配时,关闭全局模式,类似于php中的preg_ match函数;开启全局模式,类似于php中的preg_ match_ all函数)