JS中正则表达式要注意lastIndex属性
说明
这篇文章,主要和大家聊聊javascript中regexp对象的属性。
解释
每个regexp对象都包含5个属性,source、global、ignorecase、multiline、lastindex。
source:是一个只读的字符串,包含正则表达式的文本。
var reg = /javascript/; reg.source; //返回 javascript
global:是一个只读的布尔值,看这个正则表达式是否带有修饰符g。
修饰符g,是全局匹配的意思,检索字符串中所有的匹配。
var str = "javascript"; str.match(/javascript/); //只能匹配一个javascript var str = "javascript javascript"; str.match(/javascript/g); //能匹配两个javascript var reg = /javascript/; reg.global; //返回 false var reg = /javascript/g; reg.global; //返回 true
ignorecase:是一个只读的布尔值,看这个正则表达式是否带有修饰符i。
修饰符i,说明模式匹配是不区分大小写的。
var reg = /javascript/; reg.ignorecase; //返回 false var reg = /javascript/i; reg.ignorecase; //返回 true var reg = /javascript/; reg.test("javascript"); //返回 false var reg = /javascript/i; reg.test("javascript"); //返回 true
multiline:是一个只读的布尔值,看这个正则表达式是否带有修饰符m。
修饰符m,用以在多行模式中执行匹配,需要配合^ 和 $</code> 使用,使用<code>^</code> 和 <code>$ 除了匹配整个字符串的开始和结尾之外,还能匹配每行的开始和结尾。
var str="java\njavascript"; str.match(/^javascript/); //返回null var str="java\njavascript"; str.match(/^javascript/m); //匹配到一个javascript var reg=/javascript/; reg.multiline; //返回false var reg=/javascript/m; reg.multiline; //返回true
lastindex:是一个可读/写的整数,如果匹配模式中带有g修饰符,这个属性存储在整个字符串中下一次检索的开始位置,这个属性会被exec( ) 和 test( ) 方法用到。
exec( )方法是在一个字符串中执行匹配检索,如果它没有找到任何匹配,它就返回null,但如果它找到了一个匹配,它就返回一个数组。
当调用exec( )的正则表达式对象具有修饰符g时,它将把当前正则表达式对象的lastindex属性设置为紧挨着匹配子串的字符位置,当同一个正则表达式第二次调用exec( ),它会将从lastindex属性所指示的字符串处开始检索,如果exec( )没有发现任何匹配结果,它会将lastindex重置为0。
test( )方法,它的参数是一个字符串,用test( )对某个字符串进行检测,如果包含正则表达式的一个匹配结果,则返回true,否则返回false。
var str="java"; var reg=/javascript/; reg.test(str); //返回false var str="javascript"; var reg=/javascript/; reg.test(str); //返回true
当调用test( )的正则表达式对象具有修饰符g时,它的行为和exec( )相同,因为它从lastindex指定的位置处开始检索某个字符串,如果它找到了一个匹配结果,那么它就立即设置lastindex为紧挨着匹配子串的字符位置
看看下面这段有趣的代码
var str="javascript"; var reg=/javascript/g; console.log(reg.test(str)); //打印 true console.log(reg.test(str)); //打印 false
为什么同样的字符串,同样的正则表达式,却打印的不一样,如果你已经理解了 lastindex属性,那你一定明白为什么。
我们来看看到底发什么了什么
var str="javascript"; var reg=/javascript/g; console.log(reg.test(str)); //打印 true console.log(reg.lastindex); //打印10,因为匹配到了javascript,所以设置lastindex为匹配结果紧挨着的字符位置 console.log(reg.test(str)); //打印 false,因为从lastindex位置检索字符串,已经没有匹配结果了 console.log(reg.lastindex); //打印0,因为没有匹配到结果,所以将lastindex重置为0
这里注意一点,如果第一次调用test( )匹配结束后,我们手动将lastindex重置为0,那么第二次调用test( ),同样可以打印true
var str="java javascript java"; var reg=/javascript/g; console.log(reg.test(str)); //打印 true reg.lastindex=0; console.log(reg.test(str)); //打印 true
在强调一次,上面说的关于lastindex的问题,都是因为正则表达式对象中带有修饰符g,如果不带有修饰符g,就不用担心这些问题了。
总结
这次主要是说说,javascript中正则表达式对象的5个属性,而最需要注意的就是lastindex属性了。