欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

PHP用DOM方式处理HTML之Simple HTML DOM

程序员文章站 2024-01-24 15:41:28
...
近经常需要采集一些网上的数据,发现一个PHP处理HTML的利器 simple html dom,看了一下文档,使用非常方便,关键是能够用CSS选择器来访问DOM树,和jquery相似,实在是难得的利器.

入门级

simple_html_dom插件

用dom处理html文件的利器

使用:加载simple_html_dom.php文件

require_once 'simple_html_dom.php'
new simple_html_dom对象
$dom = new simple_html_dom()

加载html:

$dom->load($html);
find()方法
$dom->find('div.lookLeftname', 0)->plaintext
class='lookLeftname'的div中的纯文本
$dom->find('div.lookLeftname', 0)->innertext
class='lookLeftname'的div中的内部文本

完整测试实例,代码如下:

find('.shopname a');
        $sum = 0;
        foreach ($as as $a) {
            if ($a->plaintext != "分店") {
                $a->href = "http://www.xx.com" . $a->href;
                echo $a->outertext . "------" . $a->href . "-------
"; $sum++; } } echo "

第 {$i} 页结束 ,数目:{$sum}
"; } ?>