欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java使用正则表达式获取子文本的方法示例

程序员文章站 2024-02-28 09:33:46
本文实例讲述了java使用正则表达式获取子文本的方法。分享给大家供大家参考,具体如下: 原来,group是针对()来说的,group(0)就是指的整个串,group(1)...

本文实例讲述了java使用正则表达式获取子文本的方法。分享给大家供大家参考,具体如下:

原来,group是针对()来说的,group(0)就是指的整个串,group(1) 指的是第一个括号里的东西,group(2)指的第二个括号里的东西。

最近学习正则表达式,发现java中的一些术语与其他地方描述的有所差异。就这个问题卡了我半天,坑爹,写到博客,方便其他新学的朋友。比如java正则表达式中的“组”概念与《》一书中讲述的“子表达式”其实是一样的,只是表述不同而已。由此也引发了使用javaapi时对group(int group)start(int group)end(int group)不是太理解。

程序如下

package cn.mingyuan.regexp.singlecharacter;
import java.util.regex.matcher;
import java.util.regex.pattern;
public class groupindexandstartendindextest {
/**
* @param args
*/
public static void main(string[] args) {
  // todo auto-generated method stub
  string str = "hello,world! in java.";
  pattern pattern = pattern.compile("w(or)(ld!)");
  matcher matcher = pattern.matcher(str);
  while(matcher.find()){
  system.out.println("group 0:"+matcher.group(0));//得到第0组——整个匹配
  system.out.println("group 1:"+matcher.group(1));//得到第一组匹配——与(or)匹配的
  system.out.println("group 2:"+matcher.group(2));//得到第二组匹配——与(ld!)匹配的,组也就是子表达式
  system.out.println("start 0:"+matcher.start(0)+" end 0:"+matcher.end(0));//总匹配的索引
  system.out.println("start 1:"+matcher.start(1)+" end 1:"+matcher.end(1));//第一组匹配的索引
  system.out.println("start 2:"+matcher.start(2)+" end 2:"+matcher.end(2));//第二组匹配的索引
  system.out.println(str.substring(matcher.start(0),matcher.end(1)));//从总匹配开始索引到第1组匹配的结束索引之间子串——wor
  }
}
}

程序的运行结果为:

group 0:world!
group 1:or
group 2:ld!
start 0:6 end 0:12
start 1:7 end 1:9
start 2:9 end 2:12
wor

总结:其实group(),start(),end()所带的参数i就是正则表达式中的子表达式索引(第几个子表达式),由于刚开始对java正则表达式中的组的概念不清晰,导致理解困难。当将“组”的概念与“子表达式”对应起来之后,理解matcher的group,start,end就完全没有障碍了。

ps:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

javascript正则表达式在线测试工具:

正则表达式在线生成工具:

更多关于java算法相关内容感兴趣的读者可查看本站专题:《java正则表达式技巧大全》、《java数据结构与算法教程》、《java操作dom节点技巧总结》、《java文件与目录操作技巧汇总》和《java缓存操作技巧汇总

希望本文所述对大家java程序设计有所帮助。