欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

新浪科技文章采集代码

程序员文章站 2024-02-21 16:26:28
...
新浪科技的文章一键采集ThinkPhp适用代码
/* 新浪科技文章采集 */
public function sina_tech() {
/* NEED CAULL PAGE NUM */
$page_num = intval($_POST['get_post_page_num']);
if (empty($page_num)) $page_num = 1;
/* FIRST COUNT */
$post_count_a = M('post')->count();
/* FOR CULL */
for ($page = 1; $page
$fullpage = CurlGetPage('http://roll.tech.sina.com.cn/s/channel.php?ch=05#col=30&spec=&type=&ch=05&k=&offset_page=0&offset_num=0&num=5&asc=&page='.$page);

preg_match_all('/
\s+(.*)\s+/Us', $fullpage, $match);
$fullpage = iconv("GB2312", "UTF-8", $match[1][0]);//echo $data1;die;

preg_match_all('/
  • (.*)/isU', $fullpage, $in_li_tags);
    foreach (array_unique($in_li_tags[1]) as $row) {
    /* TITLE */
    preg_match_all('/(.*)/', $row, $title);
    $title = $title[1][0];
    /* LINK */
    preg_match_all('/href="([^"]*)"/', $row, $link);
    $link = $link[1][0];
    /* DATE */
    preg_match_all('/(.*)/i', $row, $date);
    $date = date("Y-", time()) . $date[1][0] . ':00';
    // echo $title.' '.$link.' '.$date.'
    ';

    /* GOING THE POST PAGE */
    $fullpage_post = CurlGetPage($link);
    /* FIX TAGS */
    $fullpage_post = preg_replace('/
    (.*)/isU', '${1}', $fullpage_post);
    $fullpage_post = preg_replace('/

    网友评论

    文明上网理性发言,请遵守 新闻评论服务协议

    我要评论
  • 新浪科技文章采集代码
  • 专题推荐

    作者信息
    新浪科技文章采集代码

    认证0级讲师

    推荐视频教程
  • 新浪科技文章采集代码javascript初级视频教程
  • 新浪科技文章采集代码jquery 基础视频教程
  • 视频教程分类
    相关标签: thinkphp代码,代码示例,代码参考,php短信,数据库备份代码,令牌验证,去除代码中的空白和注释php 代码

    上一篇: 详解PHP中strlen和mb_strlen函数的区别_php实例

    下一篇: 备份、引入ORA数据库(ERP克隆)RedHat 5.5+Oracle 11g (64bit)

    推荐阅读