curl爬取页面出现invalid host是什么原因?
程序员文章站
2022-05-04 13:00:01
...
我们学校教务处的网站jw.dhu.edu.cn/dhu/login_wz.jsp这个地址通过curl爬取时,返回INVALID HOST,目前测试的其他网站都可以正常爬取,是什么原因?我怀疑是学校网站禁止了访问请求?
另,在阿里云上出现同样错误,应该不是新浪云的问题。
回复内容:
我们学校教务处的网站jw.dhu.edu.cn/dhu/login_wz.jsp这个地址通过curl爬取时,返回INVALID HOST,目前测试的其他网站都可以正常爬取,是什么原因?我怀疑是学校网站禁止了访问请求?
另,在阿里云上出现同样错误,应该不是新浪云的问题。
无效主机名,域名解析有问题。
这个地址可能是配在dns上面的,只能你们校园网内部访问,在外网和sinaapp上面访问不了。
测试了很多次,学校网站也可以正常访问,是不是被反爬虫了?
用户名或密码不能为空!
上一篇: php获取当前页面url路径的二个代码
下一篇: H5学习之旅-H5的新特性(1)