欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

怎么利用爬虫爬取QQ空间中设置了权限的无法正常访问的内容?

程序员文章站 2022-06-03 23:24:50
...
怎么利用爬虫爬取QQ空间中设置了权限的无法正常访问的内容?比如很多人的空间不允许别人访问,或者有些相册不允许别人访问

回复内容:

你把 『利用爬虫爬取』 这个定语去掉,能做到,再去考虑 『利用爬虫爬取』 这个问题。 任何情况下,计算机程序都只可以做它的创造者会做的事情,只是大多数情况下比那个创造它的人做的更快、更不易出错。
意味着,如果你可以在不知道加密相册的问题的答案的情况下进入相册(如果鹅厂存在BUG且你成功钻了),那么你的爬虫也可以。 一看题主就是连爬虫都没入门的人……大家可以散了 围观这个回答,适时举报好的答案 简单的说,爬虫是用代码来模仿你的操作和浏览器的操作。
你如果可以有办法查看这些内容,你就可以用爬虫爬取了 :) 楼主放过你的意淫对象吧! 先占位,等我做出来了再答。
目前按照我的爬虫技术是觉得做不到的。为什么?
首先来看一下爬虫是这样的一个回事
对于QQ空间,而且是设置了权限的QQ空间,你是无法之间获取该空间主页的URL的(按我目前的python技术是这样)
比如下面的代码:
import urllib2
import re

url = 'http://news.bioon.com/article/xxxxx'
#由于设置了权限,这个URL无法获取的。


headers = {
		'Referer':'http://news.bioon.com/article/xxxxx',
		'User-Agent':'AppleWebKit/537.36 (KHTML, like Gecko)'
		}

request = urllib2.Request(url,headers=headers)
response = urllib2.urlopen(request)
html = response.read()

这个我知道,但是只能看到一部分,一个不懂程序的人,发现的。
我发现在我回答这个问题后腾讯把这个漏洞封了 盗取对方的 QQ 账号,进而获取网页。
侵入网站后台,进而获取网页。
都是违法的,所以能做就做。 貌似可以看看对方空间的照片还是行的,不知道现在行不行(⊙o⊙)…
本来想说一下的
不过看到连问题都提错了,最恨装逼的人了,我打游戏去 了。(⊙o⊙)…
匿名了,万一被误解成大神就不好,灌点水哈