Java正则表达式提取字符的方法实例
正好遇到一个需求需要将字符串中特定的字符全部提取出来,这个如果是按常规的字符串处理的话非常的繁琐。于是想到用正则表达式来完成。项目需求是这样的:需要提取车牌号中最后一个数字,比如说:苏a7865提取5,苏a876x提取6
实现方法:
import java.util.regex.matcher; import java.util.regex.pattern; public class test { public static void main(string[] args) { string s = "a876x"; // 把要匹配的字符串写成正则表达式,然后要提取的字符使用括号括起来 // 在这里,我们要提取最后一个数字,正则规则就是“一个数字加上大于等于0个非数字再加上结束符” pattern pattern = pattern.compile("(\\d)[^\\d]*$"); matcher matcher = pattern.matcher(s); if(matcher.find()) system.out.println(matcher.group(1)); } }
关于matcher 中的几个方法说明:
mathcer.start()/ matcher.end()/ matcher.group()
当使用matches(),lookingat(),find()执行匹配操作后,就可以利用以上三个方法得到更详细的信息.
start()返回匹配到的子字符串在字符串中的索引位置.
end()返回匹配到的子字符串的最后一个字符在字符串中的索引位置.
group()返回匹配到的子字符串
java代码示例:
pattern p=pattern.compile(“\d+”); matcher m=p.matcher(“aaa2223bb”); m.find();//匹配2223 m.start();//返回3 m.end();//返回7,返回的是2223后的索引号 m.group();//返回2223 mathcer m2=p.matcher(“2223bb”); m2.lookingat(); //匹配2223 m2.start(); //返回0,由于lookingat()只能匹配前面的字符串,所以当使用lookingat()匹配时,start()方法总是返回0 m2.end(); //返回4 m2.group(); //返回2223 matcher m3=p.matcher(“2223”); //如果matcher m3=p.matcher(“2223bb”); 那么下面的方法出错,因为不匹配返回false m3.matches(); //匹配整个字符串 m3.start(); //返回0 m3.end(); //返回3,原因相信大家也清楚了,因为matches()需要匹配所有字符串 m3.group(); //返回2223
说了这么多,相信大家都明白了以上几个方法的使用,该说说正则表达式的分组在java中是怎么使用的.
start(),end(),group()均有一个重载方法它们是start(int i),end(int i),group(int i)专用于分组操作,mathcer类还有一个groupcount()用于返回有多少组.
java代码示例:
pattern p=pattern.compile(“([a-z]+)(\d+)”); matcher m=p.matcher(“aaa2223bb”); m.find(); //匹配aaa2223 m.groupcount(); //返回2,因为有2组 m.start(1); //返回0 返回第一组匹配到的子字符串在字符串中的索引号 m.start(2); //返回3 m.end(1); //返回3 返回第一组匹配到的子字符串的最后一个字符在字符串中的索引位置. m.end(2); //返回7 m.group(1); //返回aaa,返回第一组匹配到的子字符串 m.group(2); //返回2223,返回第二组匹配到的子字符串
现在我们使用一下稍微高级点的正则匹配操作,例如有一段文本,里面有很多数字,而且这些数字是分开的,我们现在要将文本中所有数字都取出来,利用java的正则操作是那么的简单.
java代码示例:
pattern p=pattern.compile(“\d+”); matcher m=p.matcher(“我的qq是:456456 我的电话是:0532214 我的邮箱是:aaa123@aaa.com”); while(m.find()) { system.out.println(m.group()); }
输出:
456456
0532214
123
如将以上while()循环替换成
while(m.find()) { system.out.println(m.group()); system.out.print(“start:”+m.start()); system.out.println(” end:”+m.end()); }
则输出:
456456
start:6 end:12
0532214
start:19 end:26
123
start:36 end:39
现在大家应该知道,每次执行匹配操作后start(),end(),group()三个方法的值都会改变,改变成匹配到的子字符串的信息,以及它们的重载方法,也会改变成相应的信息.
注意:只有当匹配操作成功,才可以使用start(),end(),group()三个方法,否则会抛出java.lang.illegalstateexception,也就是当matches(),lookingat(),find()其中任意一个方法返回true时,才可以使用。
以上内容给介绍了java正则表达式提取字符的方法实例,希望对大家有所帮助。