欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  web前端

最短匹配模式使用详解

程序员文章站 2022-04-12 22:21:15
...
这次给大家带来最短匹配模式使用详解,使用最短匹配模式的注意事项有哪些,下面就是实战案例,一起来看一下。

前言

最近有一次想用正则表达式从网页里面抓取一些东西出来,内容不复杂却出现不少问题。下面话不多说,来一起看看详细的介绍:

当我们用正则表达式去匹配一个标签的首尾的时候,比如匹配 <h1>hello world</h1> 中的 h1 的开始和闭合标签

可能很多人会这样写

/<.*h1>/g

但是这样真的可以吗?

因为 * 匹配符是匹配前面一个字符的零到多个,而且它是贪婪匹配的

所以你得到的就会是下面的结果了。

最短匹配模式使用详解

显然这并不是我们想要的,那么怎么把贪婪匹配换成最小匹配呢,

/<.*?h1>/g

上面的写法就可以了,如下图:

最短匹配模式使用详解

其实原理应该很简单,因为 ? 也是贪婪匹配,并且只能匹配0到1个,

所以它会匹配到第一个的时候就结束了,从而阻止了 * 的匹配多个的贪婪。

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

相信看了本文案例你已经掌握了方法,更多精彩请关注其它相关文章!

推荐阅读:

Linux grep与正则表达式的使用

用正则表达式验证登录页面的输入内容

以上就是最短匹配模式使用详解的详细内容,更多请关注其它相关文章!