欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

详解正则表达式Matcher类中group方法

程序员文章站 2022-06-15 15:57:48
前言 同事把一个excel表给我,里面的数据大概有几千的样子吧。自己需要把里面的数据一个一个拿出来做一个http请求,对得到的结果进行过滤,然后再写到上面去。这是就涉及到...

前言

同事把一个excel表给我,里面的数据大概有几千的样子吧。自己需要把里面的数据一个一个拿出来做一个http请求,对得到的结果进行过滤,然后再写到上面去。这是就涉及到用脚本来进行操作了,于是自己搞了一个java的脚本出来,里面涉及到一些正则表达式,自己虽然说会,但是一直对 matcher类中的group方法 不太了解。网上的博客也没有写的特别清楚,于是有了此文。

0|1pattern 和 matcher

在java.util.regex 包下

  1. pattern(模式类) : 用来表达和陈述所要搜索模式的对象。pattern.compile(pattern) pattern 也就是你写的正则表达式
  2. matcher(匹配器类):真正影响搜索的对象。上面pattern.compile(pattern)得到一个pattern对象 为 r。 r.matcher(line) line也即是你需要进行匹配的字符串 。这样会得到一个 matcher 的对象。
  3. patternsyntaxexception: 当遇到不合法的搜索模式时,会抛出例外。

0|1正则表达式语法

在有的语言中,一个反斜杠 \ 就足以具有转义的作用,但是java中需要两个 \\ 反斜杠。表示转义的作用。一些字符在正则表达式中的说明,意义。详情可查看

0|1上代码

现在我的正则表达式为 (//d+)([a-z]+)(//d+)

  1. //d+ 表示最少匹配一个数字
  2. [a-z]+ 表示最少匹配一个字符
  3. 需要指定的字符串为 "123ra9040 123123aj234 adf12322ad 222jsk22"
  4. 代码如下 :
public static void main( string args[] ){
    // 按指定模式在字符串查找
    string line = "123ra9040 123123aj234 adf12322ad 222jsk22";
    string pattern = "(\\d+)([a-z]+)(\\d+)";
//    string pattern1 = "([\\u4e00-\\u9fa5]+|\\w+)";
    // 创建 pattern 对象
    pattern r = pattern.compile(pattern);
    // 现在创建 matcher 对象
    matcher m = r.matcher(line);
    int i = 0;
    // m.find 是否找到正则表达式中符合条件的字符串
    while (m.find( )) {
      // 拿到上面匹配到的数据
      system.out.println("----i="+i);
      system.out.println("found value: " + m.group(0) );
      system.out.println("found value: " + m.group(1) );
      system.out.println("found value: " + m.group(2) );
      system.out.println("found value: " + m.group(3) );
      i++;
      system.out.println("|||||||");
      system.out.println("");
    }
  }

输出:

----i=0
found value: 123ra9040
found value: 123
found value: ra
found value: 9040
|||||||
----i=1
found value: 123123aj234
found value: 123123
found value: aj
found value: 234
|||||||
----i=2
found value: 222jsk22
found value: 222
found value: jsk
found value: 22
|||||||

group(0) 对应着 ((//d+)([a-z]+)(//d+)) 123ra9040

group(2) 输出的数据 是 group(0)中所匹配的数据 也就是([a-z]+) 匹配到是数据 ra

group(3) 输出的数据 是 group(0)中所匹配的数据 也就是(//d+) 匹配到是数据 9040

0|1总结

matcher 类中group(0) 表示正则表达式中符合条件的字符串。

matcher 类中 group(1) 表示正则表达式中符合条件的字符串中的第一个() 中的字符串。

matcher 类中 group(2) 表示正则表达式中符合条件的字符串中的第二个() 中的字符串。

matcher 类中 group(3) 表示正则表达式中符合条件的字符串中的第三个() 中的字符串。

如果不明白,我相信看代码会很明白的。

总结

以上所述是小编给大家介绍的正则表达式matcher类中group方法,希望对大家有所帮助