正则表达式的个人理解与学习

程序员文章站 2022-07-13 13:37:37

...

正则表达式的个人理解与学习

注意：大小写的区别，大写是取反的意思。

\d: 任意一个数字，0~9中的任意一个

\w: 任意一个字母或数字或下划线，也就是A_Z,az,0~9,_中的任意一个

\s: 包括空格、制表符、换行符等空白字符的其中任意一个

. ：匹配任意字符（除了换行符），如果一般要匹配包括"\n"在内的所有字符，一般用[\s\S]

自定义字符集合:

-[]方括号匹配方式，能够匹配方括号中的任意一个字符

[aaa@qq.com] :匹配"a",“b”,5,@中的任意一个字符
[^abc]: 匹配"a",“b”,"c"之外的任意一个字符,^表示取反的意思

[f-k]: 匹配"f"~"k"之间的任意一个字符

[^A-F0-3]: 匹配"A"_“F”,"0""3"的任意一个字符，

正则表达式的个人理解与学习

现在：[\d.\-+]:中的.就代表是真正的.因为包括在[]，除了^-，已经不具有特殊意义了，要想使用加转义字符

[\s\S]:表示全部字符包括\n,\s所有空白字符，\S取反，在取或，全部字符包括换行符了

量词(Quantifier)

{m}:重复m次 eg:\d{m} ,\d\d{m} ,{\d,\d}{m}

{m,n}:最少m次，最多n次

{m,}:表达式至少重复m次

贪婪模式：就是匹配量词每次以最大的去匹配，如{1,2},每次匹配2个，在去匹配下一个还是匹配2个

非贪婪模式：和贪婪模式相反

注意：这里的贪婪模式和非贪婪模式是指在量词后面添加?，不要与下面的弄混肴了

特别重要：重要的东西看三次：?0-1次，+最少1次,*0~多次

?:0-1次

+:表达式至少1次，

*:0-多次

字符边界

-（本组标记匹配的不是字符，而是一个位置，符合某种条件的位置），零宽，不是某一个字符，而是一个位置

^ 与字符串开始的位置匹配

$ 与字符串结束的位置匹配

\b 匹配一个单词的边界：-b左右两边不全是用\w表示，即有一边不能用单词来表示呗，多容易理解

正则表达式的匹配模式

.IGNORECASE 忽略大小写模式:默认不忽略大小写

.SINGLELINE 单行模式：整个文本看做是一个字符串，只有一个开头，一个结尾

.MULTILINE 多行模式：每行都是一个字符串，都有开头和结尾，如果指定多行后还想像单行模式那样匹配^和$，用\A和\Z来表示（很容易理解嘛，A开始，Z结束）

捕获组和非捕获组

选则符和分组

表达式	作用
分支结构\|	或的关系，匹配左边或右边
()捕获组	在修饰匹配次数的时候，括号中的表达式可以做为整体被修饰，根据(来排序，\1,\2,\3来表示出现的次数
(?:Expression)	使用?:就可以使用捕获组的结构，但是又不保存()中的内容到内存，取出占用内存资源

eg:([a-z]{2})\1 abab (捕获) aabb(补捕获)

(?:[a-z]{2})\1，只使用格式但不捕获

零宽断言

(?=expression)	断言出现的位置的后面能匹配表达式exp
(?<=expression)	断言自身出现的位置的前面能匹配表达式exp
(?!exp)	断言此位置的后面不能匹配表达式exp
(?<!exp)	断言此位置的前面不能匹配表达式exp

后端断言和前端断言

记住：弄明白，其实不难

前端断言从最后端开始检测，后端断言从最前端开始检测，所谓断言不就是你自己写的表达式吗？（恍然大悟）

[a-z]+(?=ing) 匹配出现ing结尾的但不包括ing的1~多个单词

(?<=ing)[a-z] 从最左端匹配，断言的前面能出现表达式ing

实际操作：

固定电话和11位手机号：

以0开头，前面是2~3位，后面是7,8位

(0\d{2,3}-\d{7,8})|(1[35789]\{9})

电子邮箱验证：

[\w\-]+[0-9a-zA-Z]+(\.[a-zA-Z]{2,3}){1,2}

进入整体：我复习正则就是之前学的模棱两可，下面讲一下正则表达式在java中的使用：

java.util.regex包下有两个类Pattern和Matcher

注意：在java中，每次遇到正则的斜杠就多加一个\

Pattern p=Pattern.complier("\\\\w{2,4}");

Matcher matcher=p.matcher("_234");

System.out.println(matcher.matches());

关于Matcher.find()和Matcher.group()，find是子字符串匹配也返回true,group()返回匹配的分组：

	Pattern pattern=Pattern.compile("([a-z]+)([0-9]+)");
			Matcher matcher=pattern.matcher("_aaa2324");
//			System.out.println(matcher.matches());
			while(matcher.find()) {
				System.out.println(matcher.group(1));
				System.out.println(matcher.group(2));
			}
	}

字符串的替换

Pattern p=Pattern.complie("\\d+");
Matcher matcher=pattern.matcher("lcy23hha222");
String newStr=matcher.replaceAll("#");
System.out.println(newStr);

字符串的切割

String s="a23b232c32";
String [] splitChar=s.split("\\w+");
System.out.println(Arrays.toString(splitChar));

正则表达式的个人理解与学习

自定义字符集合:

量词(Quantifier)

字符边界

正则表达式的匹配模式

捕获组和非捕获组

零宽断言

理解Python中的类与实例

关于PHP堆栈与列队的学习

深入理解require与require_once与include以及include_once的区别

个人站长的win2003服务器配置与安全- Discuz实例

重新学习Mysql数据库7：详解MyIsam与InnoDB引擎的锁实现

YII2框架中behavior行为的理解与使用方法示例

conda环境的理解与安装

正则表达式中对于原生字符串的理解

深入理解Android Matrix理论与使用的详解

【电商经验】如何理解SEO与网络营销的关系？