正则的懒惰性和贪婪性的讲解
exec - > 正则的捕获
每一次捕获的时候都是先进行默认的匹配,如果没有匹配成功的,捕获的结果是null;只有有匹配的内容我们才能捕获到;
捕获的内容格式
1、捕获到的内容是一个数组,数组中的第一项是当前正则捕获的内容
index:捕获内容在字符串中开始的索引位置
input:捕获的原始字符串
reg = /\d+/ str = 'woshi2016ni2017' res =
var res = reg.exec(str); console.log(res) // ['2016',index:5,input:'woshi2016ni2017']
2、正则捕获的特点
1)、懒惰性->每一次执行exec只捕获第一个匹配的内容,在不进行任何处理的情况下,在执行多次捕获,捕获的还是第一个匹配的内容。
lastIndex:是正则每一次捕获在字符串中开始查找的位置,默认值为0
2)、如何解决懒惰性?在正则的末尾加一个修饰符"g"
修饰符:g、i、m
global(g):全局匹配
ignoreCase(i):忽略大小写匹配
multiline(m):多行匹配
var reg = /\d/g;
var str = 'woshi2016ni2017';
console.log(reg.lastIndex)
console.log(reg.exec(str))
原理:加了全局修饰符g,正则每一次捕获结束后,我们的lastIndex的值都变成了最新的值,下一次捕获从最新的位置开始查找,这样就可以把所有需要捕获的内容都获取到了
3)、自己编写程序获取正则捕获的所有的内容(一定不要忘了加g)
var reg = /\d+/g;var str = 'aswofde2015xsewde2016awdefer2017';var ary = [];var res = reg.exec(str);while(res){ ary.push(res[0]) res = reg.exec(str); } console.log(ary)//[2015,2016,2017]
4)、贪婪性 正则的每一次捕获都是按照匹配最长的结果捕获的,例如:2符合正则、2015也符合正则,我们默认捕获的是2015
5)、如何解决正则的贪婪性 ->在量词元字符后面添加一个?即可
var reg = /\d+?/g;var str = 'aswofde2015xsewde2016awdefer2017'; console.log(reg.exec(str));
?在正则中有很多的作用:
放在一个普通的元字符后面代表出现0-1次 /\d?/ ->数字可能出现也可能不出现
放在一个量词的元字符后面是取消捕获时候的贪婪性
3、字符串中的match方法->把所有和正则匹配的字符都获取到
var reg = /\d+?/g;var str = 'aswofde2015xsewde2016awdefer2017';var ary = str.match(reg);//[2,0,1,5,2,0,1,6,2,0,1,7]
虽然在当前的情况下match比我们的exec更加的简便一些,但是match中存在一些自己处理不了的问题,在分组的捕获的情况下,match只能捕获大正则匹配的内容,而对于小正则捕获的内容是无法获取的
以上就是正则的懒惰性和贪婪性的讲解的详细内容,更多请关注其它相关文章!
下一篇: 关于php抓取页面信息的容易代码