欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java基础--正则表达式的规则

程序员文章站 2022-10-04 15:10:46
注意:正则表达式只关注格式是否正确,不关注内容是否有效。 一、字符集合, []表示一个字符。 1、[abc] :指a,b,c中的任意一个字符。 2、[^abc]:指除了a,b,c外的任意字符。 3、[a-z]:表示a到z间的任意一个字符。 4、[a-zA-Z0-9]:表示a到z,A到Z,0到9的任意 ......

注意:正则表达式只关注格式是否正确,不关注内容是否有效。

一、字符集合, []表示一个字符。

  1、[abc] :指a,b,c中的任意一个字符。

  2、[^abc]:指除了a,b,c外的任意字符。

  3、[a-z]:表示a到z间的任意一个字符。

  4、[a-za-z0-9]:表示a到z,a到z,0到9的任意一个字符。

  5、[a-z&&[^bc]]:等价于[ad-z],指a到z间除了b,c字符的任意字符。

 

二、预定义字符集* ( . )表示任意一个字符。

  1、\d : 数字字符集,相当于[0-9],

  2、\w:单词字符集,相当于[a-za-z0-9_]。
  3、\s:空白字符集,相当于[\t\n\f\r\xob]。
  4、\d:非\d
  5、\w:非\w
  6、\s:非\s

 

三、数量词

  1、?表示0个或一个。
  2、* 表示0个或无穷个。
  3、+ 表示1个或无穷个。
  4、{n}表示n个。
  5、{n, }表示n个到无穷个。
  6、{n, m }表示n个到m个(m>n)。
  7、() 表示一个整体。比如:(\+86)就是表示+86,此时+需要转义。
  8、^在[]中表示非,而放在[]外,表示以……开头。比如^[0-9]就是以数字0-9开头。
  9、$表示以……结尾,比如[0-9]$就是指以数字0-9结尾。

 

四、java的string中正则表达式写法(转义的问题)

  1、11位手机号正则表达式: "^[0-9]{11}$" ;

  2、邮箱正则表达式:"^[a-za-z0-9_]+@[a-za-z0-9_]+(\.[a-za-z0-9])+$" ;此时若使用string regex = " [a-za-z0-9_]+@[a-za-z0-9_]+(\\.[a-za-z0-9])+ "; 由于java字符串认为 ( . ) 不需要进行转义,所以写成 ( \. )会报错,需要对 \ 进行转义, 即写成 ( \\. )

  3、简单的日期表达式:"^\\d{4}(\\-|\\/|\\.)\\d{1,2}\\1\\d{1,2}$"  ;  \1表示匹配第一个小括号的内容,即(\-|\/|\.)

 1 public class test {
 2     public static void main(string[] args) {
 3         string regexdemo1 = "^\\d{4}(\\-|\\/|\\.)\\d{1,2}\\1\\d{1,2}$";
 4         string str = "2019.05.22";
 5         system.out.println(str.matches(regexdemo1)); // 返回true
 6 
 7         // regexdemo1等价于regexdemo2。 其 \1 指的即为第一个小括号(), 即 \1 指的是 (\-|\/|\.)
 8         string regexdemo2 = "^\\d{4}(\\-|\\/|\\.)\\d{1,2}(\\-|\\/|\\.)\\d{1,2}$";
 9         system.out.println(str.matches(regexdemo2)); // 返回true
10     }
11 }

 

五、字符串的替换与分解(使用正则表达式)

  1、public boolean matches(string regex);判断当前字符串对象是否与参数regex格式相匹配。
  2、public string replaceall(string regex, string replacement);将字符串中符合regex格式的子串替换成replacement,此时并未改变原始字符串。

  3、public string[] split(string regex); 将字符串使用regex标记分割,并将分割后的单词存入字符串数组中。

 

 1 public class test {
 2     public static void main(string[] args) {
 3         string regex = "[0-9]+";
 4         string str = "hello123world123";
 5         system.out.println("原始字符串为: " + str);//输出hello123world123
 6 
 7         system.out.println("替换字符串后为: " +str.replaceall(regex, " welcome ")); //输出hello welcome world welcome 
 8         system.out.println("原字符串不变:" + str); //不会改变原来的字符串,输出为hello123world123
 9 
10         system.out.println("输出切割后的字符串: ");
11         string digitword[] = str.split(regex); // 以regex格式分割
12         for (string s : digitword) {
13             system.out.println(s);
14         }
15     }
16 }
17 /*
18 测试结果为:
19 原始字符串为: hello123world123
20 替换字符串后为: hello welcome world welcome 
21 原字符串不变:hello123world123
22 输出切割后的字符串: 
23 hello
24 world
25 */