JavaScript 正则表达式
程序员文章站
2022-05-03 11:46:37
什么是正则表达式: 1、正则表达式是由一个字符序列形成的搜索模式。 2、当你在文本中搜索数据时,你可以用搜索模式来描述你要查询的内容。 3、正则表达式可以是一个简单的字符,或一个更复杂的模式。 4、正则表达式可用于所有文本搜索和文本替换的操作。 5、JavaScript 中的正则表达式用 RegEx ......
什么是正则表达式:
1、正则表达式是由一个字符序列形成的搜索模式。
2、当你在文本中搜索数据时,你可以用搜索模式来描述你要查询的内容。
3、正则表达式可以是一个简单的字符,或一个更复杂的模式。
4、正则表达式可用于所有文本搜索和文本替换的操作。
5、javascript 中的正则表达式用 regexp 对象表示,可以使用 regexp() 构造函数来创建 regexp 对象,也可以通过直接量语法(包含在一对斜杆之间的字符)来创建
// 匹配所有以字符 's' 结尾的字符串,$ 表示匹配字符串的结尾 var pattern1 = new regexp("s$"); var pattern2 = /s$/;
注:正则表达式里具有特殊含义的标点符号:^ $ . * + ? = ! : | \ / ( ) [ ] { },使用这些字符的直接量时必须加前缀 \
匹配分类:
1、字符类
let str = "hello words"; // [...] 匹配方框内任意字符,a-f 表示范围 let pattern = /[a-f]/; console.log(str.match(pattern)); // [^...] 匹配不在方框内任意字符 pattern = /[^a-f]/; console.log(str.match(pattern)); // . 匹配除换行符和其他 unicode 行终止符之外的任意字符 pattern = /./; console.log(str.match(pattern)); /* \w 匹配任意 ascii 字符组成的单词,等价于 [a-za-z0-9] \w 匹配任意不是 ascii 字符组成的单词,等价于 [^a-za-z0-9] \s 匹配任何 unicode 空白符 \s 匹配任何不是 unicode 空白符 \d 匹配数字,等价于[0-9] \d 匹配非数字,等价于[^0-9] [\b] 退格直接量 */ // 匹配任意不是 ascii 字符组成的单词或匹配数字 pattern = /[\w\d]/; console.log(str.match(pattern));
2、重复
let str = "hello words"; // {n, m} 匹配前一项至少 n 次,最多 m 次;{n,} 匹配 n 次或更多次;{n} 匹配 n 次 let pattern = /\w{2,4}/; console.log(str.match(pattern)); // ? 匹配前一项 0 次或 1 次,等价于 {0, 1} // + 匹配前一项 1 次或多次,等价于 {1, } // * 匹配前一项 0 次或多次,等价于 {0, } pattern = /\w?/; console.log(str.match(pattern)); // 默认会尽可能多的匹配字符,如以下会匹配 hello pattern = /\w+/; console.log(str.match(pattern)); // 可在待匹配字符后面添加 ?,使它尽可能少的匹配 pattern = /\w+?/; // 匹配 h console.log(str.match(pattern)); // 注意 * 和 ? 可以匹配 0 个字符,下面的 index 会返回 0 pattern = /\d*/; console.log(str.match(pattern));
3、选择、分组和引用
let str = "abc123def"; // one|two[|...] 是匹配 one 或 two,从左往右匹配 let pattern = /ab|de/; console.log(str.match(pattern)); // (...) 将几个项组合成一个单元,同时记住这个组合匹配的字符串以供此后的引用使用 pattern = /\d+(\w+)\1/; console.log(str.match(pattern)); // (?:...) 只组合,但不记忆该组合匹配字符串 pattern = /\w(?:\w+)\d+(\w+)/ console.log(str.match(pattern)); // \n 匹配第 n 个分组,从左往右,(?:...)不计入分组 str = "javascript is fun"; // 本来应该匹配 (fun\w*),但返回了 null? pattern = /([jj]ava(?:[ss]cript)?)\sis\s(fun\w*)\2/; console.log(str.match(pattern));
4、指定位置匹配
let str = "javascript is fun"; // ^ 匹配字符串开头,注意和 [^...] 的区别 let pattern = /^\w+/; console.log(str.match(pattern)); // $ 匹配字符串的结尾 pattern = /\d+$/; console.log(str.match(pattern)); // \b 匹配单词的边界 pattern = /\b\w+\b/; console.log(str.match(pattern)); // \b 匹配非单词边界部分 pattern = /\b\w+\b/; console.log(str.match(pattern)); // (?=p) 零宽正向先行断言,要求接下来的字符都于 p 匹配,但不包括 p pattern = /\s\w+(?=\s)/; console.log(str.match(pattern)); //匹配 ' is' // (?!p) 零宽负向先行断言,要求接下来的字符都不与 p 匹配 pattern = /\s\w+(?!\w+)/; console.log(str.match(pattern)); //匹配 ' is'
5、修饰符
(1) i:不区分大小写匹配
(2) g:全局匹配,找出所有匹配
(3) m:多行匹配模式, ^ 匹配一行的开头和字符串的开头,$ 匹配行的结尾和字符串的结尾
// 格式为 /pattern/modifiers let pattern = /[a-z]\d+/i
用于模式匹配的 string 方法:
search()、replace()、match()、split()
/* search() 的参数是一个正则表达式,返回第一个匹配子串的下标 search() 不支持全局检索(g),若无匹配则返回 -1!! 若其参数不是正则表达式,则会调用 regexp 构造函数将其转换为正则表达式 */
let str = "javascript is fun"; let pattern = /\s+\w+/; console.log("\"", str.match(pattern)[0], " \" its index is: ", str.search(pattern)); // replace() 第一个参数是正则表达式,第二个参数是供替换的字符串,也可以是个动态计算字符串的函数 pattern = /javascript/i; console.log("the original str: ", str, "\nafter replace: ", str.replace(pattern, "javascript")); /* match(exp) 接受唯一一个参数就是正则表达式,它返回一个匹配结果组成的数组 该数组 arr[0] 存放完整匹配,arr[1] 存放第一个圆括号括起来表达式相匹配的子串 以此类推 arr[n] 存放第 n 个圆括号括起来表达式相匹配的子串 (?:...) 不计入在内!!! */ let text = "http://www.cnblogs.com/lemonyam"; // 需要用 '\' 转义 '/' let url = /(\w+):\/\/([\w.]+)\/(\s*)/; let result = text.match(url); if (result != null) { console.log("fullurl: ", result[0]); console.log("protocol: ", result[1]); console.log("host: ", result[2]); console.log("path: ", result[3]); } // split() 将按 split 的参数,把调用它的字符串拆成一个子串组成的数组,该参数可以是正则表达式! let temp = "1, 2, 3, 4".split(/\s*,\s*/); console.log(temp); //返回['1', '2', '3', '4']
上一篇: 在python中实现格式化输出的方法
下一篇: C语言编程笔记丨位反转的最佳算法