关于快讯采集,仅提取频道列表中新增项
程序员文章站
2022-05-19 23:32:06
...
关于新闻采集,仅提取频道列表中新增项
做新闻采集程序,以腾讯的某频道为例“http://tech.qq.com/hlwxw.htm” 。每30分钟上来扫描看看有没有新增新闻,可能上面频道的列表增加了两条,其他23条都是已经抓完的了(一共25条的列表),仅把这两条能出来放进数据库,请问应该怎样做??
------解决方案--------------------
每抓一条新闻,都把那条新闻的id存储在你的表里。比如
exists_id
----------
1231
1232
1233
...
采集的时候,先判断下这条新闻的id是否在你那个表里存在。。。
然后就不用说了
做新闻采集程序,以腾讯的某频道为例“http://tech.qq.com/hlwxw.htm” 。每30分钟上来扫描看看有没有新增新闻,可能上面频道的列表增加了两条,其他23条都是已经抓完的了(一共25条的列表),仅把这两条能出来放进数据库,请问应该怎样做??
------解决方案--------------------
每抓一条新闻,都把那条新闻的id存储在你的表里。比如
exists_id
----------
1231
1232
1233
...
采集的时候,先判断下这条新闻的id是否在你那个表里存在。。。
然后就不用说了
相关文章
相关视频
专题推荐
-
独孤九贱-php全栈开发教程
全栈 170W+
主讲:Peter-Zhu 轻松幽默、简短易学,非常适合PHP学习入门
-
玉女心经-web前端开发教程
入门 80W+
主讲:灭绝师太 由浅入深、明快简洁,非常适合前端学习入门
-
天龙八部-实战开发教程
实战 120W+
主讲:西门大官人 思路清晰、严谨规范,适合有一定web编程基础学习
网友评论
文明上网理性发言,请遵守 新闻评论服务协议
我要评论