怎么抓取网页实时内容
程序员文章站
2022-06-14 13:18:18
...
如何抓取网页实时内容
#网址:http://data.shishicai.cn/cqssc/haoma/
#Demo:
/* Created on [2013-5-1] Author[Newton] Filename[action.php]*/
#编码转换
function convToUtf8($str) {
if (mb_detect_encoding($str, "UTF-8, ISO-8859-1, GBK") != "UTF-8") {
return iconv("GBK", "utf-8", $str);
} else {
return $str;
}
}
header("content-type:text/html;charset:utf-8");
error_reporting(E_ERROR);
$pages = file_get_contents('http://data.shishicai.cn/cqssc/haoma/');
//$pages = htmlspecialchars($pages);
$pages = convToUtf8($pages);
echo "pages-->>".print_r($pages);echo PHP_EOL;
$doc = new DOMDocument();
$new_doc = new DOMDocument('1.0', 'utf-8');
echo "doc-->>".print_r($doc);echo PHP_EOL;
$dom = $doc->getElementsByTagName('table');
$newdoc = $new_doc->loadhtml($dom->item(2)->nodeValue);
$table = $new_doc->saveHTML();
echo "table-->>{$table}".PHP_EOL;
#result:
#……乱码……
#pages-->>1 DOMDocument Object ( ) doc-->>1 table-->>
#table是空的……
?>
PHP
DOM
专题推荐
-
独孤九贱-php全栈开发教程
全栈 170W+
主讲:Peter-Zhu 轻松幽默、简短易学,非常适合PHP学习入门
-
玉女心经-web前端开发教程
入门 80W+
主讲:灭绝师太 由浅入深、明快简洁,非常适合前端学习入门
-
天龙八部-实战开发教程
实战 120W+
主讲:西门大官人 思路清晰、严谨规范,适合有一定web编程基础学习
- 最新文章
- 热门排行
网友评论
文明上网理性发言,请遵守 新闻评论服务协议
我要评论