欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

这种正则表达式怎么写?求高手解答!

程序员文章站 2024-01-24 20:53:29
...
有一个网页中的代码如下:

      

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

...

大家注意到没有 class="1",class="2",class="3",...是有规律的,但是前面的标签没有规律,有时是span,有时是div,我想要的是用php如何写正则表达式获取class="1",class="2",class="3",...的内容,正则表达式这方面学的不好,试了半天都写不出来,求高手解答!

回复讨论(解决方案)

html或xml的东西有专门的dom api,特别是标签嵌套的html,尽量不要尝试用正则去获取,尤其是php的正则,这里涉及到正则的递归,即使php能有象其它语言提供的正则平衡组,也最好不要用。

\s+

(.*?)\s+
\s*(.*?)\s*\s*

谢谢两位的回答!

$s =      

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

TXT;

方案1
include 'phpquery.php';$doc = phpQuery::newDocument($s);echo $doc->find('.1')->html();echo pq('.2')->html();
      

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

方案2
include 'html_document.php';$p = new html_document( $s, 0);foreach($p->find('.\d') as $v) {    echo "$v->innerHTML\n";}
      

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

testtesttesttesttesttestt

testtesttest

testtesttesttesttesttesttesttesttest

感谢版主大大 ,手快早给结贴了

这种正则表达式怎么写?求高手解答!

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

相关文章

相关视频