欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

正则表达式的个人理解与学习

程序员文章站 2022-07-13 13:37:37
...

正则表达式的个人理解与学习

注意:大小写的区别,大写是取反的意思。

\d: 任意一个数字,0~9中的任意一个

\w: 任意一个字母或数字或下划线,也就是AZ,az,0~9,_中的任意一个

\s: 包括空格、制表符、换行符等空白字符的其中任意一个

. : 匹配任意字符(除了换行符),如果一般要匹配包括"\n"在内的所有字符,一般用[\s\S]

自定义字符集合:

-[]方括号匹配方式,能够匹配方括号中的任意一个字符

[aaa@qq.com] :匹配"a",“b”,5,@中的任意一个字符
[^abc]: 匹配"a",“b”,"c"之外的任意一个字符,^表示取反的意思

[f-k]: 匹配"f"~"k"之间的任意一个字符

[^A-F0-3]: 匹配"A"“F”,"0""3"的任意一个字符,

正则表达式的个人理解与学习

现在:[\d.\-+]:中的.就代表是真正的.因为包括在[],除了^-,已经不具有特殊意义了,要想使用加转义字符

[\s\S]:表示全部字符包括\n,\s所有空白字符,\S取反,在取或,全部字符包括换行符了

量词(Quantifier)

{m}:重复m次 eg:\d{m} ,\d\d{m} ,{\d,\d}{m}

{m,n}:最少m次,最多n次

{m,}:表达式至少重复m次

贪婪模式:就是匹配量词每次以最大的去匹配,如{1,2},每次匹配2个,在去匹配下一个还是匹配2个

非贪婪模式:和贪婪模式相反

注意:这里的贪婪模式和非贪婪模式是指在量词后面添加?,不要与下面的弄混肴了

特别重要:重要的东西看三次:?0-1次,+最少1次,*0~多次

?:0-1次

+:表达式至少1次,

*:0-多次

字符边界

-(本组标记匹配的不是字符,而是一个位置,符合某种条件的位置),零宽,不是某一个字符,而是一个位置

^ 与字符串开始的位置匹配

$ 与字符串结束的位置匹配

\b 匹配一个单词的边界:-b左右两边不全是用\w表示,即有一边不能用单词来表示呗,多容易理解

正则表达式的匹配模式

.IGNORECASE 忽略大小写模式:默认不忽略大小写

.SINGLELINE 单行模式:整个文本看做是一个字符串,只有一个开头,一个结尾

.MULTILINE 多行模式:每行都是一个字符串,都有开头和结尾,如果指定多行后还想像单行模式那样匹配^和$,用\A和\Z来表示(很容易理解嘛,A开始,Z结束)

捕获组和非捕获组

选则符和分组

表达式 作用
分支结构| 或的关系,匹配左边或右边
()捕获组 在修饰匹配次数的时候,括号中的表达式可以
做为整体被修饰,根据(来排序,\1,\2,\3来表示
出现的次数
(?:Expression) 使用?:就可以使用捕获组的结构,但是又不保存()中的内容到内存,取出占用内存资源

eg:([a-z]{2})\1 abab (捕获) aabb(补捕获)

​ (?:[a-z]{2})\1,只使用格式但不捕获

零宽断言
(?=expression) 断言出现的位置的后面能匹配表达式exp
(?<=expression) 断言自身出现的位置的前面能匹配表达式exp
(?!exp) 断言此位置的后面不能匹配表达式exp
(?<!exp) 断言此位置的前面不能匹配表达式exp

后端断言和前端断言

记住:弄明白,其实不难

前端断言从最后端开始检测,后端断言从最前端开始检测,所谓断言不就是你自己写的表达式吗?(恍然大悟)

[a-z]+(?=ing) 匹配出现ing结尾的但不包括ing的1~多个单词

(?<=ing)[a-z] 从最左端匹配,断言的前面能出现表达式ing

实际操作:

固定电话和11位手机号:

以0开头,前面是2~3位,后面是7,8位

(0\d{2,3}-\d{7,8})|(1[35789]\{9})

电子邮箱验证:

[\w\-]+[0-9a-zA-Z]+(\.[a-zA-Z]{2,3}){1,2}

进入整体:我复习正则就是之前学的模棱两可,下面讲一下正则表达式在java中的使用:

java.util.regex包下有两个类Pattern和Matcher

注意:在java中,每次遇到正则的斜杠就多加一个\

Pattern p=Pattern.complier("\\\\w{2,4}");

Matcher matcher=p.matcher("_234");

System.out.println(matcher.matches());

关于Matcher.find()和Matcher.group(),find是子字符串匹配也返回true,group()返回匹配的分组:

	Pattern pattern=Pattern.compile("([a-z]+)([0-9]+)");
			Matcher matcher=pattern.matcher("_aaa2324");
//			System.out.println(matcher.matches());
			while(matcher.find()) {
				System.out.println(matcher.group(1));
				System.out.println(matcher.group(2));
			}
	}

字符串的替换

Pattern p=Pattern.complie("\\d+");
Matcher matcher=pattern.matcher("lcy23hha222");
String newStr=matcher.replaceAll("#");
System.out.println(newStr);

字符串的切割

String s="a23b232c32";
String [] splitChar=s.split("\\w+");
System.out.println(Arrays.toString(splitChar));