欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

Curl写请求盗取金十网首页数据,附thinkphp源码包

程序员文章站 2022-05-13 15:04:53
...
玩了curl后发现php正则真的很重要,可惜我很菜。拿了网页上的三个字段写了个demo。下面贴的代码复制下来可以直接运行。其实就是用别人的数据自己做API的一种思路。
function getwebcontent($url){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);
$contents = trim(curl_exec($ch));
curl_close($ch);
return $contents;
}
function DeleteHtml($str) {
$str = trim($str);
$str = str_replace("\t","",$str);
$str = str_replace("\r\n","",$str);
$str = str_replace("\r","",$str);
$str = str_replace("\n","",$str);
return trim($str);
}
set_time_limit(0);
$datas =DeleteHtml(getwebcontent('http://www.jin10.com'));
preg_match_all('/(\d{2}:\d{2})/',$datas,$time); /*对应的所有时间*/
preg_match_all('/]+?id\s*?=\s*?"content_\d+?">(.+?)/',$datas,$content); /*对应的所有内容*/
preg_match_all('/"普通新闻"|"重要新闻"|"一般数据"|"重要数据"/',$datas,$importance); /*对应的所有新闻的重要性*/
$contents=$content[1]; /*对应的所有内容*/
$times=$time[1]; /*对应的所有时间*/
$importances=$importance[0];

$news=[];
foreach ($contents as $key => $value) {
$t=[
"content"=>$value,
"time"=>$times[$key],
"importance"=>str_replace('"','',$importances[$key]),
];
array_push($news,$t);
}
var_dump($news);

?>

Curl写请求盗取金十网首页数据,附thinkphp源码包 109news.rar ( 1.12 MB 下载:7 次 )

Curl写请求盗取金十网首页数据,附thinkphp源码包

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

相关文章

相关视频


网友评论

文明上网理性发言,请遵守 新闻评论服务协议

我要评论
  • Curl写请求盗取金十网首页数据,附thinkphp源码包
  • 专题推荐

    作者信息
    Curl写请求盗取金十网首页数据,附thinkphp源码包

    认证0级讲师

    推荐视频教程
  • Curl写请求盗取金十网首页数据,附thinkphp源码包javascript初级视频教程
  • Curl写请求盗取金十网首页数据,附thinkphp源码包jquery 基础视频教程
  • 视频教程分类