正则表达式u修饰符(支持UTF-16编码)
程序员文章站
2022-06-23 11:25:48
正则表达式u修饰符:
此修饰符标识能够正确处理大于\uffff的unicode字符。
也就是说,会正确处理四个字节的utf-16编码。
此修饰符是es2015新增,更...
正则表达式u修饰符:
此修饰符标识能够正确处理大于\uffff的unicode字符。
也就是说,会正确处理四个字节的utf-16编码。
此修饰符是es2015新增,更多正则表达式新特性可以参阅es2015 正则表达式新增特性一章节。
更多正则表达式教程可以参阅正则表达式教程板块。
代码实例:
console.log(/^\ud842/u.test("\ud842\udfb7"))
输出false,由于"\ud842\udfb7"是一个四个字节的utf-16编码,代表一个字符,所以如果正则表达式带有u修饰符,那么就能够识别它。
console.log(/^\ud842/.test("\ud842\udfb7"))
输出true;不加u修饰符,那么就无法将四个字节的utf-16编码识别为一个字符,所以就可以产生匹配。
/^.$/.test("\ud842\udfb7")//false /^.$/u.test("\ud842\udfb7")//true
关于元字符点(.)的用法可以参阅正则表达式.号元字符一章节。
/^.$/.test("\ud842\udfb7")//false /^.$/u.test("\ud842\udfb7")//true
添加u修饰符之后,点元字符就可以匹配码点大于0xffff的unicode字符。
/ \u{61} /.test("a")//false / \u{61} / u.test("a")//true
使用u修饰符,正则表达式能够识别大括号{}表示的unicode字符,否则无法识别,{61}也会被解读为量词,表示61个u字符。
关于大括号表示的unicode字符可以参阅es2015 字符串新增特性一章节。