欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

我想采集一个网站里面新闻的标题和网址。要怎么做?

程序员文章站 2022-06-03 09:09:49
...
我想做一个学校的门户网站,门户里面放的是学校的新闻网的新闻。如果我想再门户一个区块里放新闻网的新闻标题和链接,要怎么做采集?是要每天采集一次还是它会自动采集到最新的内容?求详细点,新手,没接触过采集~~


回复讨论(解决方案)

这要采集干什么?从数据库里读就是了

你的代码怎么写他就怎么采集,如果你要随时更新最新的内容那么你就要按时的读取数据分析是否是最新的.

直接用file_get_content 得到你要采集的网站内容,在正则表达式是匹配出你要的内容,在自己入库就好了啊

这要采集干什么?从数据库里读就是了
我现在只是做测试,拿不到相应的数据库信息~~

一般门户上的新闻列表都是根据时间排列的,每天采集,采集最新更新的前几条就可以。写个定时任务,每天定时采集一次或N次

ecshop有个任务计划功能 你可以参考一下