浅谈正则表达式 实例入门
程序员文章站
2022-06-15 16:03:26
很长时间没看 正则表达式了,碰巧今天用到,温故知新了一把 看书学习吧 50% 的举一反三练习中的原创。 一 javascript正则表达式的基本知识 1 javascrip...
很长时间没看 正则表达式了,碰巧今天用到,温故知新了一把 看书学习吧
50% 的举一反三练习中的原创。
一 javascript正则表达式的基本知识
1 javascript 正则对象创建 和用法
声明javascript 正则表达式
var recat = new regexp("cat");
你也可以
var recat = /cat/; //perl 风格 (推荐)
2 学习最常用的 test exec match search replace split 6个方法
1) test 检查指定的字符串是否存在
var data = "123123";
var recat = /123/gi;
alert(recat.test(data)); //true
//检查字符是否存在 g 继续往下走 i 不区分大小写
2) exec 返回查询值
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /cat/i;
alert(recat.exec(data)); //cat
3)match 得到查询数组
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /cat/gi;
var arrmactches = data.match(recat)
for (var i=0;i < arrmactches.length ; i++)
{
alert(arrmactches[i]); //cat cat
}
4) search 返回搜索位置 类似于indexof
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /cat/gi;
alert(data.search(recat)); //23
5) replace 替换字符 利用正则替换
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /cat/gi;
alert(data.replace(recat,"libinqq"));
6)split 利用正则分割数组
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /\,/;
var arrdata = data.split(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
3 学习下 简单类 负向类 范围类 组合类
//简单类
var data = "1libinqq,2libinqq,3libinqq,4libinqq";
var recat = /[123]libinqq/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // 1libinqq 2libinqq 3libinqq
}
//负向类
var data = "alibinqq,1libinqq,2libinqq,3libinqq,4libinqq"; //\u0062cf
var recat = /[^a123]libinqq/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); //4libinqq
}
//范围类
var data = "libinqq1,libinqq2,libinqq3,libinqq4,libinqq5"; //\u0062cf
var recat = /libinqq[2-3]/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // libinqq2 libinqq3
}
//组合类
var data = "a,b,c,w,1,2,3,5"; //\u0062cf
var recat = /[a-q1-4\n]/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // a b c 1 2 3
}
这些都是 js正则 最基本的使用方法,看不会的请复制到笔记本练习下,看会了再往下面看。
二 javascript 正则表达式是分组知识
1) 简单分组
<script language="javascript">
<!--
/*正则表达式 简单的分组
举例 我们要查找字符串 mousemouse
var recat = /mousemouse/gi;
尽管这是可以的,但是有点浪费。如果不知道mouse 在字符串中到底出现几次时该怎么办,如果重复多次呢。
var recat = /(mouse){2}/gi; 括号的意思列mouse 将在一行连续出现2次。
*/
var data = "ah-mousemouse";
var recat = /(mouse){2}/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
//-->
</script>
2 复杂分组
<script language="javascript">
<!--
/*正则表达式 复杂的分组
? 零次 或 一次
* 零次 或 多次
+ 最少一次 或 多次
*/
var data = "bb ba da bad dad aa ";
var recat = /([bd]ad?)/gi; // 匹配出 ba da bad dad
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
// 同时 也不介意将分组放在分组中间
// var re = /(mom( and dad)?)/; 匹配出 mom 或 mon and daa
//-->
</script>
3 反向引用
<script language="javascript">
<!--
/*正则表达式 反向引用*/
var stomatch = "#123456789";
var renumbers = /#(\d+)/;
renumbers.test(stomatch);
alert(regexp.$1);
/*
这个例子尝试匹配后面跟着几个或多个数字的镑符合,并对数字进行分组
以存储他们。在调用 test 方法后,所有的反向引用都保存到了 regexp 构造函数中
从 regexp.$1(它保存了第一个反向引用)开始,如果还有第二个反向引用,就是
regexp.$2,如果还有第三个反向引用存在,就是 regexp.$3.依此类推。因为该组
匹配了 “123456780”,所以 regexp.$1 中就存储了这个字符串。
*/
var stochange = "1234 5678";
var rematch = /(\d{4}) (\d{4})/;
var snew = stochange.replace(rematch,"$2 $1");
alert(snew);
/*
在这个例子中,正则表达式有两个分组,每一个分组有四个数字。在 replace() 方法的第二个参数
中,$2 等同于 “5678” ,而 $1 等同于 “1234”,对应于它们在表达式中的出现顺序。
*/
//-->
</script>
4 候选
<script language="javascript">
<!--
/*正则表达式 候选 */
var stomatch1 = "red";
var stomatch2 = "black";
var rered = /red/;
var reblack = /black/;
alert(rered.test(stomatch1) || reblack.test(stomatch1));
alert(rered.test(stomatch2) || reblack.test(stomatch2));
/*
这虽然能完成任务,但是十分沉长,还有另一种方式就是正则表达式的候选操作符。
*/
var stomatch1 = "red";
var stomatch2 = "black";
var reredorblack = /(red|black)/;
alert(reredorblack.test(stomatch1));
alert(reredorblack.test(stomatch2));
//-->
</script>
5 非捕获性分组
<script language="javascript">
<!--
/*正则表达式 非捕获性分组
如果要创建一个非捕获性分组,只要在左括号的后面加上一个问号和一个紧跟的冒号:
*/
var stomatch = "#123456789";
var renumbers = /#(?:\d+)/;
renumbers.test(stomatch);
alert(regexp.$1);
/*
这个例子的最后一行代码输出一个空字符串,因为该组是非捕获性的,
*/
var stomatch = "#123456789";
var renumbers = /#(?:\d+)/;
alert(stomatch.replace(renumbers,"abcd$1"));
/*
正因如此,replace()方法就不能通过 regexp.$x 变量来使用任何反向引用,这段代码
输出的“abcd$1”而不是abcd123456789, 因为$1 在这里并不被看成是一个反向引用。
*/
//-->
</script>
6 前瞻
<script language="javascript">
<!--
/*正则表达式 前瞻
前瞻 就和它名字一样,它告诉正则表达式运算器向前看一些字符而不是移动位置
*/
var stomatch1 = "bedroom";
var stomatch2 = "bedding";
var rebed = /bed(?=room)/;
alert(rebed.test(stomatch1)); //true
alert(rebed.test(stomatch2)); //false
//负向前瞻
var stomatch1 = "bedroom";
var stomatch2 = "bedding";
var rebed = /bed(?!room)/;
alert(rebed.test(stomatch1)); //false
alert(rebed.test(stomatch2)); //true
//-->
</script>
7 边界
<script language="javascript">
<!--
/*正则表达式 边界
^ 行开头
$ 行结尾
\b 单词的边界
\b 非单词的边界
*/
var stomatch = "important word is the last one.";
var relastword = /(\w+)\.$/;
relastword.test(stomatch);
alert(regexp.$1); //one
/*
假如想查找一个单词,但要它只出现在行尾,则可以使用美元符号 ($)来表示它:
*/
var stomatch = "important word is the last one.";
var relastword = /^(\w+)/;
relastword.test(stomatch);
alert(regexp.$1); //important
/*
在这个例子中,正则表达式查找行起始位置后的一个或多个单词字符。如果遇到非单词字符
匹配停止,返回 important。 这个例子也可以用单词边界实现。
*/
var stomatch = "important word is the last one.";
var relastword = /^(.+?)\b/;
relastword.test(stomatch);
alert(regexp.$1); //important
/*
这里,正则表达式用惰性量词来制定在单词边界之前可以出现任何字符,且可以出现一次或
多次(如果使用贪婪性量词,表达式就匹配整个字符串)。
*/
var data = " first second thind fourth fifth sixth ";
var recat = /\b(\s+?)\b/g;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
/*
使用单词边界可以方便地从字符串中抽取单词。
*/
//-->
</script>
8 多行模式
code
<script language="javascript">
<!--
/*正则表达式 多行模式
要制定多行模式,只要在正则表达式想要匹配的行末的一个单词
*/
var data = " first second\n thind fourth\n fifth sixth";
var recat = /(\w+)$/g;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
/*
上面只返回一个单词 sixth,因为换行符阻挡了匹配,只能匹配行末的一个单词,
当然也可以使用 split() 方法将字符串分割成数组,但就得对每一行进行单独匹配。
以前不好好看书经常半吊子,看一半就仍了,导致用了好多 split, 其实很简单如下面
例子 只需要 m 参数进行多行匹配。
*/
var data = " first second\n thind fourth\n fifth sixth";
var recat = /(\w+)$/gm;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
//-->
</script>
至此结束,这些都是 javascript 正则表达式的基本方法,如果你看会了看复杂的正则你会有豁然开朗的感觉。
50% 的举一反三练习中的原创。
一 javascript正则表达式的基本知识
1 javascript 正则对象创建 和用法
声明javascript 正则表达式
复制代码 代码如下:
var recat = new regexp("cat");
你也可以
var recat = /cat/; //perl 风格 (推荐)
2 学习最常用的 test exec match search replace split 6个方法
1) test 检查指定的字符串是否存在
复制代码 代码如下:
var data = "123123";
var recat = /123/gi;
alert(recat.test(data)); //true
//检查字符是否存在 g 继续往下走 i 不区分大小写
2) exec 返回查询值
复制代码 代码如下:
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /cat/i;
alert(recat.exec(data)); //cat
3)match 得到查询数组
复制代码 代码如下:
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /cat/gi;
var arrmactches = data.match(recat)
for (var i=0;i < arrmactches.length ; i++)
{
alert(arrmactches[i]); //cat cat
}
4) search 返回搜索位置 类似于indexof
复制代码 代码如下:
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /cat/gi;
alert(data.search(recat)); //23
5) replace 替换字符 利用正则替换
复制代码 代码如下:
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /cat/gi;
alert(data.replace(recat,"libinqq"));
6)split 利用正则分割数组
复制代码 代码如下:
var data = "123123,213,12312,312,3,cat,cat,dsfsdfs,";
var recat = /\,/;
var arrdata = data.split(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
3 学习下 简单类 负向类 范围类 组合类
复制代码 代码如下:
//简单类
var data = "1libinqq,2libinqq,3libinqq,4libinqq";
var recat = /[123]libinqq/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // 1libinqq 2libinqq 3libinqq
}
//负向类
var data = "alibinqq,1libinqq,2libinqq,3libinqq,4libinqq"; //\u0062cf
var recat = /[^a123]libinqq/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); //4libinqq
}
//范围类
var data = "libinqq1,libinqq2,libinqq3,libinqq4,libinqq5"; //\u0062cf
var recat = /libinqq[2-3]/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // libinqq2 libinqq3
}
//组合类
var data = "a,b,c,w,1,2,3,5"; //\u0062cf
var recat = /[a-q1-4\n]/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // a b c 1 2 3
}
这些都是 js正则 最基本的使用方法,看不会的请复制到笔记本练习下,看会了再往下面看。
二 javascript 正则表达式是分组知识
1) 简单分组
复制代码 代码如下:
<script language="javascript">
<!--
/*正则表达式 简单的分组
举例 我们要查找字符串 mousemouse
var recat = /mousemouse/gi;
尽管这是可以的,但是有点浪费。如果不知道mouse 在字符串中到底出现几次时该怎么办,如果重复多次呢。
var recat = /(mouse){2}/gi; 括号的意思列mouse 将在一行连续出现2次。
*/
var data = "ah-mousemouse";
var recat = /(mouse){2}/gi;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
//-->
</script>
2 复杂分组
复制代码 代码如下:
<script language="javascript">
<!--
/*正则表达式 复杂的分组
? 零次 或 一次
* 零次 或 多次
+ 最少一次 或 多次
*/
var data = "bb ba da bad dad aa ";
var recat = /([bd]ad?)/gi; // 匹配出 ba da bad dad
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
// 同时 也不介意将分组放在分组中间
// var re = /(mom( and dad)?)/; 匹配出 mom 或 mon and daa
//-->
</script>
3 反向引用
复制代码 代码如下:
<script language="javascript">
<!--
/*正则表达式 反向引用*/
var stomatch = "#123456789";
var renumbers = /#(\d+)/;
renumbers.test(stomatch);
alert(regexp.$1);
/*
这个例子尝试匹配后面跟着几个或多个数字的镑符合,并对数字进行分组
以存储他们。在调用 test 方法后,所有的反向引用都保存到了 regexp 构造函数中
从 regexp.$1(它保存了第一个反向引用)开始,如果还有第二个反向引用,就是
regexp.$2,如果还有第三个反向引用存在,就是 regexp.$3.依此类推。因为该组
匹配了 “123456780”,所以 regexp.$1 中就存储了这个字符串。
*/
var stochange = "1234 5678";
var rematch = /(\d{4}) (\d{4})/;
var snew = stochange.replace(rematch,"$2 $1");
alert(snew);
/*
在这个例子中,正则表达式有两个分组,每一个分组有四个数字。在 replace() 方法的第二个参数
中,$2 等同于 “5678” ,而 $1 等同于 “1234”,对应于它们在表达式中的出现顺序。
*/
//-->
</script>
4 候选
复制代码 代码如下:
<script language="javascript">
<!--
/*正则表达式 候选 */
var stomatch1 = "red";
var stomatch2 = "black";
var rered = /red/;
var reblack = /black/;
alert(rered.test(stomatch1) || reblack.test(stomatch1));
alert(rered.test(stomatch2) || reblack.test(stomatch2));
/*
这虽然能完成任务,但是十分沉长,还有另一种方式就是正则表达式的候选操作符。
*/
var stomatch1 = "red";
var stomatch2 = "black";
var reredorblack = /(red|black)/;
alert(reredorblack.test(stomatch1));
alert(reredorblack.test(stomatch2));
//-->
</script>
5 非捕获性分组
复制代码 代码如下:
<script language="javascript">
<!--
/*正则表达式 非捕获性分组
如果要创建一个非捕获性分组,只要在左括号的后面加上一个问号和一个紧跟的冒号:
*/
var stomatch = "#123456789";
var renumbers = /#(?:\d+)/;
renumbers.test(stomatch);
alert(regexp.$1);
/*
这个例子的最后一行代码输出一个空字符串,因为该组是非捕获性的,
*/
var stomatch = "#123456789";
var renumbers = /#(?:\d+)/;
alert(stomatch.replace(renumbers,"abcd$1"));
/*
正因如此,replace()方法就不能通过 regexp.$x 变量来使用任何反向引用,这段代码
输出的“abcd$1”而不是abcd123456789, 因为$1 在这里并不被看成是一个反向引用。
*/
//-->
</script>
6 前瞻
复制代码 代码如下:
<script language="javascript">
<!--
/*正则表达式 前瞻
前瞻 就和它名字一样,它告诉正则表达式运算器向前看一些字符而不是移动位置
*/
var stomatch1 = "bedroom";
var stomatch2 = "bedding";
var rebed = /bed(?=room)/;
alert(rebed.test(stomatch1)); //true
alert(rebed.test(stomatch2)); //false
//负向前瞻
var stomatch1 = "bedroom";
var stomatch2 = "bedding";
var rebed = /bed(?!room)/;
alert(rebed.test(stomatch1)); //false
alert(rebed.test(stomatch2)); //true
//-->
</script>
7 边界
复制代码 代码如下:
<script language="javascript">
<!--
/*正则表达式 边界
^ 行开头
$ 行结尾
\b 单词的边界
\b 非单词的边界
*/
var stomatch = "important word is the last one.";
var relastword = /(\w+)\.$/;
relastword.test(stomatch);
alert(regexp.$1); //one
/*
假如想查找一个单词,但要它只出现在行尾,则可以使用美元符号 ($)来表示它:
*/
var stomatch = "important word is the last one.";
var relastword = /^(\w+)/;
relastword.test(stomatch);
alert(regexp.$1); //important
/*
在这个例子中,正则表达式查找行起始位置后的一个或多个单词字符。如果遇到非单词字符
匹配停止,返回 important。 这个例子也可以用单词边界实现。
*/
var stomatch = "important word is the last one.";
var relastword = /^(.+?)\b/;
relastword.test(stomatch);
alert(regexp.$1); //important
/*
这里,正则表达式用惰性量词来制定在单词边界之前可以出现任何字符,且可以出现一次或
多次(如果使用贪婪性量词,表达式就匹配整个字符串)。
*/
var data = " first second thind fourth fifth sixth ";
var recat = /\b(\s+?)\b/g;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
/*
使用单词边界可以方便地从字符串中抽取单词。
*/
//-->
</script>
8 多行模式
code
复制代码 代码如下:
<script language="javascript">
<!--
/*正则表达式 多行模式
要制定多行模式,只要在正则表达式想要匹配的行末的一个单词
*/
var data = " first second\n thind fourth\n fifth sixth";
var recat = /(\w+)$/g;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
/*
上面只返回一个单词 sixth,因为换行符阻挡了匹配,只能匹配行末的一个单词,
当然也可以使用 split() 方法将字符串分割成数组,但就得对每一行进行单独匹配。
以前不好好看书经常半吊子,看一半就仍了,导致用了好多 split, 其实很简单如下面
例子 只需要 m 参数进行多行匹配。
*/
var data = " first second\n thind fourth\n fifth sixth";
var recat = /(\w+)$/gm;
var arrdata = data.match(recat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
//-->
</script>
至此结束,这些都是 javascript 正则表达式的基本方法,如果你看会了看复杂的正则你会有豁然开朗的感觉。
上一篇: MongoDB磁盘IO问题的3种解决方法
下一篇: node.js之express的基础知识