用php解析html的实现代码

程序员文章站 2022-05-12 11:45:57

最近想用php写一个爬虫，就需要解析html，在sourceforge上找到一个项目叫做php simple html dom parser，它可以以类似jquery的方式...

最近想用php写一个爬虫，就需要解析html，在sourceforge上找到一个项目叫做php simple html dom parser，它可以以类似jquery的方式通过css选择器来返回指定的dom元素，功能十分强大。
首先要在程序的开始引入simple_html_dom.php这个文件

复制代码代码如下:

include_once('simple_html_dom.php');

php simple html dom parser提供了3种方式来创建dom对象

复制代码代码如下:

 
// create a dom object from a string 
$html = str_get_html('<html><body>hello!</body></html>'); 
// create a dom object from a url 
$html = file_get_html('http://www.google.com/'); 
// create a dom object from a html file 
$html = file_get_html('test.htm'); 

得到dom对象后就可以进行各种操作了

复制代码代码如下:

 
// find all anchors, returns a array of element objects 
$ret = $html->find('a'); 
// find (n)th anchor, returns element object or null if not found (zero based) 
$ret = $html->find('a', 0); 
// find lastest anchor, returns element object or null if not found (zero based) 
$ret = $html->find('a', -1); 
// find all <div> with the id attribute 
$ret = $html->find('div[id]'); 
// find all <div> which attribute id=foo 
$ret = $html->find('div[id=foo]'); 

这里可以使用各种css选择器，就像在jquery中进行dom操作一样，非常方便。此外，还有两个特殊的属性可以得到文本和注释的内容

复制代码代码如下:

 
// find all text blocks 
$es = $html->find('text'); 
// find all comment (<!--...-->) blocks 
$es = $html->find('comment'); 

当然，还是类似于jquery，php simple html dom parser也支持链式操作，以及各种访问dom元素的简单方法

复制代码代码如下:

 
// example 
echo $html->find("#div1", 0)->children(1)->children(1)->children(2)->id; 
// or 
echo $html->getelementbyid("div1")->childnodes(1)->childnodes(1)->childnodes(2)->getattribute('id'); 

上一篇： PHP缓存技术的使用说明

下一篇： 2020智算之道初赛第一场 - 高校组 A.排队

用php解析html的实现代码

PHP实现HTML页面静态化的方法

php用xpath解析html的代码实例讲解

Html5 canvas实现粒子时钟的示例代码

php利用云片网实现短信验证码功能的示例代码

PHP将HTML转换成文本的实现代码

用javascript实现隐藏状态栏的代码

php实现首页链接查询友情链接检查的代码

用php实现的获取网页中的图片并保存到本地的代码

HTML5调用手机摄像头拍照的实现思路及代码

用php获取本周,上周,本月,上月,本季度日期的代码

用php解析html的实现代码

PHP实现HTML页面静态化的方法

php用xpath解析html的代码实例讲解

Html5 canvas实现粒子时钟的示例代码

php利用云片网实现短信验证码功能的示例代码

PHP将HTML转换成文本的实现代码

用javascript实现隐藏状态栏的代码

php实现首页链接查询 友情链接检查的代码

用php实现的获取网页中的图片并保存到本地的代码

HTML5调用手机摄像头拍照的实现思路及代码

用php获取本周,上周,本月,上月,本季度日期的代码

php实现首页链接查询友情链接检查的代码