这个问题CSDN不能搞定就没人可以搞定了
程序员文章站
2022-05-16 20:01:16
...
本人做了一个采集。 在本地测试,可以正常采集。
放在服务器上,也可以采集。 但是。。。。
目标站,内容更新后,,,服务器上,要过 好几个小时才能采。 (有时要隔一天)
而本地,不用等,只要目标站有数据,就可以采到。
感觉就像采数据的时候,网页没有刷新一样。
是 服务器 问题? 还是程序不够好?(程序上,每次刷新的时候,都是重新载入页面! ,还加了 随机字符),给公司的技术也看过了,都说程序没问题
我问了空间商,他说要我报错过去, 我怎么报? 请高手中的高手帮忙解决!
到底是什么问题?
放在服务器上,也可以采集。 但是。。。。
目标站,内容更新后,,,服务器上,要过 好几个小时才能采。 (有时要隔一天)
而本地,不用等,只要目标站有数据,就可以采到。
感觉就像采数据的时候,网页没有刷新一样。
是 服务器 问题? 还是程序不够好?(程序上,每次刷新的时候,都是重新载入页面! ,还加了 随机字符),给公司的技术也看过了,都说程序没问题
我问了空间商,他说要我报错过去, 我怎么报? 请高手中的高手帮忙解决!
到底是什么问题?
回复讨论(解决方案)
你是如何控制采集程序工作的?
你Q多少,我联系你。。
QQ288801 谢谢 帮我 看下
2888801 刚才少了一个 8
QQ288801 谢谢 帮我 看下
CSDN最忌讳留QQ了。有问题就请在贴子里说。能帮的大家会帮助你的。。
对程序 我也不是 很清楚, 。。但问了 搞技术的 同事,程序没问题 所以想让 高手 帮我 看看程序
你可以把采集部分的代码贴出来。
if($_GET["action"]=="cai")
{
$PageUrl = "http://www.xxxxx.com/?id=".time();
$Pagecontent = file_get_contents($PageUrl);
$start = strpos($Pagecontent,"
");
$EndHtml = strpos($Pagecontent,"
$EndHtml = strpos($Pagecontent,"
");
$lenHtml = $EndHtml - $start;
$Pagecontent = substr($Pagecontent,$start,$lenHtml);
$HtmlAll = "";
preg_match_all('/(.*?)/',$Pagecontent,$UrlList);
for($i=sizeof($UrlList[2]);$i>=0;$i--){
$InUrl = "http://www.zhibo8.com".$UrlList[2][$i];
$TermDay = $_POST["txtdate"];
//$HtmlAll = $HtmlAll.$InUrl."-----".$TermDay."\r\n";
if(strstr($InUrl,$TermDay) && strstr($InUrl,"nba"))
{
$InContent = file_get_contents($InUrl);
//$start1 = strpos($InContent,"
$lenHtml = $EndHtml - $start;
$Pagecontent = substr($Pagecontent,$start,$lenHtml);
$HtmlAll = "";
preg_match_all('/(.*?)/',$Pagecontent,$UrlList);
for($i=sizeof($UrlList[2]);$i>=0;$i--){
$InUrl = "http://www.zhibo8.com".$UrlList[2][$i];
$TermDay = $_POST["txtdate"];
//$HtmlAll = $HtmlAll.$InUrl."-----".$TermDay."\r\n";
if(strstr($InUrl,$TermDay) && strstr($InUrl,"nba"))
{
$InContent = file_get_contents($InUrl);
//$start1 = strpos($InContent,"
");
//$EndHtml1 = strpos($InContent,"
//$EndHtml1 = strpos($InContent,"
网友评论
文明上网理性发言,请遵守 新闻评论服务协议
我要评论