html内容

" /> html内容

- 程序员文章站" />
欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

php正则表达式匹配

html内容

程序员文章站 2022-05-02 11:50:01
...
最近需要抓取网页内容,但是正则表达式不是很熟悉,写起来很是困难。
现在需要匹配这样的

标签

哪位大神能给个正则表达式呢,就当练练手哈,感激不尽!

回复内容:

最近需要抓取网页内容,但是正则表达式不是很熟悉,写起来很是困难。
现在需要匹配这样的

标签

哪位大神能给个正则表达式呢,就当练练手哈,感激不尽!

虽然本人不是phper,但是也通过各种途径进行过HTML parsing。
题主的问题我们可以用正则、DOM、Xpath、css query解决。
正则会随着更改变得难以理解,
尽管DOM更加易读,但非常繁琐,
Xpath会带来HTML clean的问题,
我强烈推荐用css query方式。

题主可以试试一下类库:
http://simplehtmldom.sourceforge.net/
https://code.google.com/p/phpquery/

http://txt2re.com 解决你的头痛问题...RegExp生成器(反正我不会用)
信手写了个

$regexp=/

.*

/g;

我没在PHP下测试...并且临时写的 也比较臃肿