正则表达式中的反向预搜索(上)
程序员文章站
2022-07-02 19:41:12
在以前的应用,大多是应用正向预搜索情况。也就是说,在查找内容的右面有特定的内容限定,例如下面的例子: 复制代码 代码如下:var str3 = 'cpu: intel co...
在以前的应用,大多是应用正向预搜索情况。也就是说,在查找内容的右面有特定的内容限定,例如下面的例子:
var str3 = 'cpu: intel core2 5200; memory: 2g;os: ubuntu 9.04';
var reg3 = /memory\:\s+(.*(?=\;os\:))/gim;
str3.match(reg3);
alert(regexp.$1); //结果是2g
(.*(?=\;os\:) 就是典型的正向预搜索,只有右面内容是“;os: ”才会被匹配到。
但是现在要实现的效果,左面的内容是固定,而不是右面。可是javascript并不支持反向预搜索。我相信,细心的朋友已经发现了,其实上面的例子已经达到了这个目的(前面的memory\:\s+ 限定了左面的内容)。下面再给出一个例子:
//程序目的,去掉图片路径中的域名
var str = '<img src="http://news.163.com/sports/yao.jpg" >';
var reg1 = /(\<img)(.*(?=(http|https)\:\/\/))((http|https)\:\/\/[^\/]*)/gim;
str.match(reg1);
alert(str.replace(regexp.$4,''));
那么到底有没有反向预搜索呢?答案是肯定的,可是现实是残酷的。我查阅了一些资料,上面提到反向预搜索的形式是以?<= 或者?<! 为引导的。遗憾的是javascript并不支持,在高版本的java中已获支持,于是就编写了下面的测试程序(jre1.6.0_03):
import java.util.regex.matcher;
import java.util.regex.pattern;
public class regexptest {
public static void main(string[] args){
pattern p = pattern.compile("((?<=\\<img.*(?=(http|https)))(http|https))");
matcher matcher = p.matcher("<img src="http://news.163.com/sports/yao.jpg"/>");
system.out.println(matcher.matches());
}
}
程序本身应该没有什么问题,但是运行结果:
exception in thread "main" java.util.regex.patternsyntaxexception: look-behind group does not have an obvious maximum length near index 27
((?<=\<img.*(?=(http|https)))(http|https))
我google了半天,最后得到的唯一结果就是换种写法。希望看到这篇文章的朋友,如果已经实现了这种效果,一定要留言不吝赐教。
另外,在我看文档时看到了?:引导的正则表达式,上面说是“匹配不存储”,百思不得其解。感觉还是代码来的实在,写一个看一下:
var str2 = '客户端名称';
var reg2 = /(客户端名(?:称)?)/;
str2.match(reg2);
alert(regexp.$1); //客户端名称
alert(regexp.$2); //空字符串
//不使用?:
reg2 = /(客户端名(称)?)/;
str2.match(reg2);
alert(regexp.$1); //客户端名称
alert(regexp.$2); //称
敏捷开发思想说:代码是最好的文档。给了我借口,呵呵。
复制代码 代码如下:
var str3 = 'cpu: intel core2 5200; memory: 2g;os: ubuntu 9.04';
var reg3 = /memory\:\s+(.*(?=\;os\:))/gim;
str3.match(reg3);
alert(regexp.$1); //结果是2g
(.*(?=\;os\:) 就是典型的正向预搜索,只有右面内容是“;os: ”才会被匹配到。
但是现在要实现的效果,左面的内容是固定,而不是右面。可是javascript并不支持反向预搜索。我相信,细心的朋友已经发现了,其实上面的例子已经达到了这个目的(前面的memory\:\s+ 限定了左面的内容)。下面再给出一个例子:
复制代码 代码如下:
//程序目的,去掉图片路径中的域名
var str = '<img src="http://news.163.com/sports/yao.jpg" >';
var reg1 = /(\<img)(.*(?=(http|https)\:\/\/))((http|https)\:\/\/[^\/]*)/gim;
str.match(reg1);
alert(str.replace(regexp.$4,''));
那么到底有没有反向预搜索呢?答案是肯定的,可是现实是残酷的。我查阅了一些资料,上面提到反向预搜索的形式是以?<= 或者?<! 为引导的。遗憾的是javascript并不支持,在高版本的java中已获支持,于是就编写了下面的测试程序(jre1.6.0_03):
复制代码 代码如下:
import java.util.regex.matcher;
import java.util.regex.pattern;
public class regexptest {
public static void main(string[] args){
pattern p = pattern.compile("((?<=\\<img.*(?=(http|https)))(http|https))");
matcher matcher = p.matcher("<img src="http://news.163.com/sports/yao.jpg"/>");
system.out.println(matcher.matches());
}
}
程序本身应该没有什么问题,但是运行结果:
exception in thread "main" java.util.regex.patternsyntaxexception: look-behind group does not have an obvious maximum length near index 27
((?<=\<img.*(?=(http|https)))(http|https))
我google了半天,最后得到的唯一结果就是换种写法。希望看到这篇文章的朋友,如果已经实现了这种效果,一定要留言不吝赐教。
另外,在我看文档时看到了?:引导的正则表达式,上面说是“匹配不存储”,百思不得其解。感觉还是代码来的实在,写一个看一下:
复制代码 代码如下:
var str2 = '客户端名称';
var reg2 = /(客户端名(?:称)?)/;
str2.match(reg2);
alert(regexp.$1); //客户端名称
alert(regexp.$2); //空字符串
//不使用?:
reg2 = /(客户端名(称)?)/;
str2.match(reg2);
alert(regexp.$1); //客户端名称
alert(regexp.$2); //称
敏捷开发思想说:代码是最好的文档。给了我借口,呵呵。
上一篇: CSS3 实现文字阴影效果