爬虫获取AJax数据问题

程序员文章站 2022-03-12 08:57:33

...

想写一个爬取花瓣网图片的爬虫。遇到了Ajax获取数据的问题
爬虫获取AJax数据问题
图片中的请求的URL，Response的文本类型是json
可当我单独访问这个url的时候却是html

求教，怎么获取json数据

回复内容：

求教，怎么获取json数据

这个是用header来控制的
爬虫获取AJax数据问题

你把对应的请求头加上就好了。附上我的代码

#coding=utf-8

import requests as RQ

hburl = "http://huaban.com/boards/28195582/?ipva9fpx&max=759391397&limit=20&wfl=1"
heads = {
'Host':"huaban.com",
'Referer':"{http://huaban.com/boards/28195582/",
'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.84 Safari/537.36",
'X-Request':"JSON",
'X-Requested-With':"XMLHttpRequest"
}


print RQ.get(hburl, headers=heads).content

Rerferer是一个常见的用来防止网页被本站之外获取的Header，做爬虫时一定要确保Referer的设置

相关标签：网页爬虫 python java php http

上一篇： Ajax实现动态加载数据的实力分享

下一篇：按钮的Ajax请求时一次点击两次提交的解决方法

爬虫获取AJax数据问题

回复内容：

php从数据库中获取数据用ajax传送到前台的方法

Ajax异步获取html数据中包含js方法无效的解决方法

python爬虫的数据库连接问题【推荐】

php+ajax导入大数据时产生的问题处理

page分页问题，根据页码获取对应页面的数据，接口调用

IE9下Ajax无法刷新数据的缓存问题解决方法

ajax获取数据中文乱码问题最简单的完美解决方案

jQuery中使用Ajax获取JSON格式数据示例代码

php从数据库中获取数据用ajax传送到前台的方法

JSP中获取ExtJS.Ajax前台传递的JSON数据实现过程