JavaScript 正则表达式

程序员文章站 2022-05-03 11:46:37

什么是正则表达式： 1、正则表达式是由一个字符序列形成的搜索模式。 2、当你在文本中搜索数据时，你可以用搜索模式来描述你要查询的内容。 3、正则表达式可以是一个简单的字符，或一个更复杂的模式。 4、正则表达式可用于所有文本搜索和文本替换的操作。 5、JavaScript 中的正则表达式用 RegEx ......

什么是正则表达式：

　　1、正则表达式是由一个字符序列形成的搜索模式。

　　2、当你在文本中搜索数据时，你可以用搜索模式来描述你要查询的内容。

　　3、正则表达式可以是一个简单的字符，或一个更复杂的模式。

　　4、正则表达式可用于所有文本搜索和文本替换的操作。

　　5、javascript 中的正则表达式用 regexp 对象表示，可以使用 regexp() 构造函数来创建 regexp 对象，也可以通过直接量语法（包含在一对斜杆之间的字符）来创建

//    匹配所有以字符 's' 结尾的字符串，$ 表示匹配字符串的结尾
var pattern1 = new regexp("s$");
var pattern2 = /s$/;

注：正则表达式里具有特殊含义的标点符号：^ $ . * + ? = ! : | \ / ( ) [ ] { }，使用这些字符的直接量时必须加前缀 \

匹配分类：

1、字符类

let str = "hello words";

// [...] 匹配方框内任意字符，a-f 表示范围
let pattern = /[a-f]/;
console.log(str.match(pattern));

// [^...] 匹配不在方框内任意字符
pattern = /[^a-f]/;
console.log(str.match(pattern));

// . 匹配除换行符和其他 unicode 行终止符之外的任意字符
pattern = /./;
console.log(str.match(pattern));

/*
    \w 匹配任意 ascii 字符组成的单词，等价于 [a-za-z0-9]
    \w 匹配任意不是 ascii 字符组成的单词，等价于 [^a-za-z0-9]
    \s 匹配任何 unicode 空白符
    \s 匹配任何不是 unicode 空白符
    \d 匹配数字，等价于[0-9]
    \d 匹配非数字，等价于[^0-9]
    [\b] 退格直接量
 */

// 匹配任意不是 ascii 字符组成的单词或匹配数字
pattern = /[\w\d]/;
console.log(str.match(pattern));

2、重复

let str = "hello words";

// {n, m} 匹配前一项至少 n 次，最多 m 次；{n，} 匹配 n 次或更多次；{n} 匹配 n 次
let pattern = /\w{2,4}/;
console.log(str.match(pattern));

// ? 匹配前一项 0 次或 1 次，等价于 {0, 1}
// + 匹配前一项 1 次或多次，等价于 {1, }
// * 匹配前一项 0 次或多次，等价于 {0, }
pattern = /\w?/;
console.log(str.match(pattern));

// 默认会尽可能多的匹配字符，如以下会匹配 hello
pattern = /\w+/;
console.log(str.match(pattern));

// 可在待匹配字符后面添加 ?，使它尽可能少的匹配
pattern = /\w+?/;   // 匹配 h
console.log(str.match(pattern));

// 注意 * 和 ? 可以匹配 0 个字符，下面的 index 会返回 0
pattern = /\d*/;
console.log(str.match(pattern));

3、选择、分组和引用

let str = "abc123def";

// one|two[|...] 是匹配 one 或 two，从左往右匹配
let pattern = /ab|de/;
console.log(str.match(pattern));

// (...) 将几个项组合成一个单元，同时记住这个组合匹配的字符串以供此后的引用使用
pattern = /\d+(\w+)\1/;
console.log(str.match(pattern));

// (?:...) 只组合，但不记忆该组合匹配字符串
pattern = /\w(?:\w+)\d+(\w+)/
console.log(str.match(pattern));

// \n 匹配第 n 个分组，从左往右，(?:...)不计入分组
str = "javascript is fun";
// 本来应该匹配 (fun\w*)，但返回了 null？
pattern = /([jj]ava(?:[ss]cript)?)\sis\s(fun\w*)\2/;
console.log(str.match(pattern));

4、指定位置匹配

let str = "javascript is fun";

// ^ 匹配字符串开头，注意和 [^...] 的区别
let pattern = /^\w+/;
console.log(str.match(pattern));

// $ 匹配字符串的结尾
pattern = /\d+$/;
console.log(str.match(pattern));

// \b 匹配单词的边界
pattern = /\b\w+\b/;
console.log(str.match(pattern));

// \b 匹配非单词边界部分
pattern = /\b\w+\b/;
console.log(str.match(pattern));

// (?=p) 零宽正向先行断言，要求接下来的字符都于 p 匹配，但不包括 p
pattern = /\s\w+(?=\s)/;

console.log(str.match(pattern)); //匹配 ' is'

// (?!p) 零宽负向先行断言，要求接下来的字符都不与 p 匹配
pattern = /\s\w+(?!\w+)/;
console.log(str.match(pattern)); //匹配 ' is'

5、修饰符

(1) i：不区分大小写匹配

(2) g：全局匹配，找出所有匹配

(3) m：多行匹配模式， ^ 匹配一行的开头和字符串的开头，$ 匹配行的结尾和字符串的结尾

// 格式为 /pattern/modifiers
let pattern = /[a-z]\d+/i

用于模式匹配的 string 方法：

　　search()、replace()、match()、split()

/*
    search() 的参数是一个正则表达式，返回第一个匹配子串的下标
    search() 不支持全局检索(g)，若无匹配则返回 -1！！
    若其参数不是正则表达式，则会调用 regexp 构造函数将其转换为正则表达式
*/
let str = "javascript is fun";
let pattern = /\s+\w+/;
console.log("\"", str.match(pattern)[0], " \" its index is: ", str.search(pattern));

// replace() 第一个参数是正则表达式，第二个参数是供替换的字符串，也可以是个动态计算字符串的函数
pattern = /javascript/i;
console.log("the original str: ", str, "\nafter replace: ", str.replace(pattern, "javascript"));

/*
    match(exp) 接受唯一一个参数就是正则表达式，它返回一个匹配结果组成的数组
    该数组 arr[0] 存放完整匹配，arr[1] 存放第一个圆括号括起来表达式相匹配的子串
    以此类推 arr[n] 存放第 n 个圆括号括起来表达式相匹配的子串
    (?:...) 不计入在内！！！
*/
let text = "http://www.cnblogs.com/lemonyam";
// 需要用 '\' 转义 '/'
let url = /(\w+):\/\/([\w.]+)\/(\s*)/;
let result = text.match(url);
if (result != null) {
    console.log("fullurl: ", result[0]);
    console.log("protocol: ", result[1]);
    console.log("host: ", result[2]);
    console.log("path: ", result[3]);
}

// split() 将按 split 的参数，把调用它的字符串拆成一个子串组成的数组，该参数可以是正则表达式！
let temp = "1, 2, 3, 4".split(/\s*,\s*/);
console.log(temp); //返回['1', '2', '3', '4']

上一篇：在python中实现格式化输出的方法

下一篇： C语言编程笔记丨位反转的最佳算法

JavaScript 正则表达式

iOS App开发中Objective-C使用正则表达式进行匹配的方法

利用Python正则表达式过滤敏感词的方法

javascript html5轻松实现拖动功能

JavaScript创建命名空间的5种写法

浅谈JavaScript中的apply/call/bind和this的使用

javascript 删除数组元素和清空数组的简单方法

JavaScript页面加载事件实例讲解

JavaScript正则获取地址栏中参数的方法

JavaScript基础之this和箭头函数详析

JavaScript基本类型值-Number类型