欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

RegExp 随笔 JavaScript RegExp 对象

程序员文章站 2022-03-27 09:22:45
概述 regexp 的构造函数创建了一个正则表达式对象,用模式来匹配文本。 有关正则表达式介绍,请阅读javascript指南中的正则表达式章节。 语法 文字和构造...

概述

regexp 的构造函数创建了一个正则表达式对象,用模式来匹配文本。

有关正则表达式介绍,请阅读javascript指南中的正则表达式章节。

语法

文字和构造符号是可能的:
/pattern/flags new regexp(pattern [, flags])

参数

pattern
正则表达式的文本
flags
如果指定,标志可以具有以下值的任意组合:

g
全局匹配
i
忽略大小写
m
多行;让开始和结束字符(^ 和 $)工作在多行模式工作(例如,^ 和 $ 可以匹配字符串中每一行的开始和结束(行是由 \n 或 \r 分割的),而不只是整个输入字符串的最开始和最末尾处。
u
unicode。把模式当作unicode代码点(code points)的序列。
y
黏度; 在目标字符串中,只从正则表达式的lastindex属性指定的显示位置开始匹配(并且不试图从任何之后的索引匹配)。
描述
有两种方法可以创建一个正则对象:字面量和构造函数。要表示字符串,字面量形式不使用引号,而传递给构造函数的参数使用引号。下面表达式创建相同的正则表达式:

/ab+c/i;
new regexp('ab+c', 'i');
new regexp(/ab+c/, 'i');

当表达式被赋值时,字面量形式提供正则表达式的编译(compilation)状态,当正则表达式保持为常量时使用字面量。例如当你在循环中使用字面量构造一个正则表达式时,正则表达式不会在每一次迭代中都被重新编译(recompiled)。
而正则表达式对象的构造函数,如 new regexp('ab+c') 提供了正则表达式运行时编译(runtime compilation)。如果你知道正则表达式模式将会改变,或者你事先不知道什么模式,而是从另一个来源获取,如用户输入,这些情况都可以使用构造函数。
从ecmascript 6开始,当第一个参数为正则表达式而第二个标志参数存在时,new regexp(/ab+c/, 'i')不再抛出typeerror (“当从其他正则表达式进行构造时不支持标志”)的异常,取而代之,将使用这些参数创建一个新的正则表达式。

当使用构造函数创造正则对象时,需要常规的字符转义规则(在前面加反斜杠 \)。比如,以下是等价的:

var re = new regexp("\\w+");
var re = /\w+/;

以字面量定义正则表达式
var expression = /pattern/ flags;
pattern 部分可以是任何简单或复杂的正则表达示
flage 标明正则表达式的行为 1.g:全局模式,不会在发现第一个匹配项后停止 2.i:不区分大小写模式 3.m:多行模式
例:

var pattern1 = /at/g; //匹配字符串中所有at
var pattern2 = /[bc]at/i; //匹配第一个“bat”或“cat”,不区分大小写
var pattern3 = /.at/gi; //全局匹配以.at“结尾”的三个字符。不区分小写

模式中使用的所有元字符都必须转义。正则表达式中的元字符包括:([{\^$|?*+.}])
例:

var pattern4 = /\[bc\]at/i; //匹配第一个“[bc]at”,不区分大小写

使用regexp构造函数,接受2个参数,参数1:要匹配的字符串模式,参数2:可选的标志行为
例:

var pattern5 = new regexp("[bc]at", "i");

注:因为regexp构造函数的模式参数都是字符串,所以在某些情况下要对字符串进行双重转义。所有元字符必须双重转义

例:
字面量        等价字符串
/\[bc\]at/      "\\[bc\\]at"
/\.at/        "\\.at"
/name/\age/    "name\\/age"
/\d.\d{1,2}/    "\\d.\\d{1,2}"
/\w\\hello\\123/ "\\w\\\\hello\\\\123"

注:使用字面量和实例化创建正则表达式不一样,字面量始终会共享同一个regexp实例(ecmascript3)。使用构造函数创建的每一个新的regexp实例都是一个新实例。

regexp实例属性

console.log(pattern5.global); //false 是否设置了g标志
console.log(pattern5.ignorecase); //true 是否设置了i标志
console.log(pattern5.multiline); //false 是否设置了m标志
console.log(pattern5.lastindex); //0 开始搜索下一个匹配项的起始位置
console.log(pattern5.source); //[bc]at 正则表达式的字符串表示

继承属性

console.log(pattern5.tostring()); // /[bc]at/i 正则表达式的字面量表示
console.log(pattern5.tolocalestring()); // /[bc]at/i 正则表达式的字面量表示
console.log(pattern5.valueof()); // /[bc]at/i 正则表达式的字面量表示

regexp实例方法
方法一:exec(),接受一个参数,既应用模式字符串。返回返回包含第一个匹配项信息的数组,在没有的情况下返回null,返回的数组实例包含两个属性index(匹配项在字符中的位置)和input(应用正则的字符串)。

var text = "huang jin liang shi ge hao ren";
var pattern6 = new regexp("huang( jin liang( shi ge hao ren)?)?", "i");
var matches = pattern6.exec(text);
console.log(matches); 
//[ 'huang jin liang shi ge hao ren',
// ' jin liang shi ge hao ren',
// ' shi ge hao ren',
// index: 0,
// input: 'huang jin liang shi ge hao ren' ]

var text1 = "cat, bat, sat";
var pattern7 = new regexp(".at")
var matches1 = pattern7.exec(text1);
console.log(matches1); //cat

var pattern8 = new regexp(".at", "gm");
var matches2 = pattern8.exec(text1);
console.log(matches2); //cat
var matches3 = pattern8.exec(text1);
console.log(matches3); //bat
var matches4 = pattern8.exec(text1);
console.log(matches4); //sat
var matches5 = pattern8.exec(text1);
console.log(matches5); //null

方法二:test(),接受一个参数,既应用模式字符串。该模式与该参数匹配的情况下返回true,反之false

var text2 = "000-00-0000";
var pattern9 = new regexp("\\d{3}-\\d{2}-\\d{4}");
console.log(pattern9.test(text2))
console.log(text2);
if (pattern9.test(text2)) {
console.log("匹配成功");
} else {
console.log("匹配失败");
}

构造函数属性(某些浏览器不支持)
长属性名    短属性名 说明
input      $_    最近一次要匹配的字符串
lastmatch    $&    最近一次匹配项
lastparen    $+    最近一次捕获组
leftcontext    $`    input字符串中lastmatch之前的文本
multiline    $*    布尔,是否是多行模式
rightcontext $'    input字符串中lastmatch之后的文本
        $1~$9 分别用于存储第几个捕获组

在ecmascript局限性
1.匹配字符串开始和结束的\a和\z锚
2.向后查找
3.并集和交集类
4.原子组
5.unicode支持(单个字符除外)
6.命名捕获组
7.s和x匹配模式
8.条件匹配
9.正则表达式注释

刚发现一个js中匹配多行的方法

<script>
var s = "please yes\nmake my day!";
alert(s.match(/yes.*day/));
// returns null
alert(s.match(/yes[^]*day/));
// returns 'yes\nmake my day'
</script>

可惜了,editplus不能用,很多时候还是使用dw比较方便。