Python爬虫(四)——模拟登录imooc实战(利用cookie)
程序员文章站
2024-03-16 14:26:28
...
该实战是模拟登录慕课网,并且进入个人课程页面
一、思路
1、获取登录cookie,并保存。
2、进入个人课程页面
二、代码
#!/usr/bin/env python
# -*- coding:utf-8 -*-
# author: xulinjie time:2017/11/1
import urllib2
import urllib
import cookielib
filename='cookie.txt'
cookie=cookielib.MozillaCookieJar(filename)
headler=urllib2.HTTPCookieProcessor(cookie)
opener=urllib2.build_opener(headler)
value={"email":"xxxxxxx","password":"xxxxxxxx"}
data=urllib.urlencode(value)#转码
loginURL=r'http://www.imooc.com/'#因为登录页面和首页是在一起的
opener.open(loginURL,data)#模拟登录,并把cookie保存到变量
cookie.save(ignore_discard=True,ignore_expires=True)#保存cookie到cookie.txt中
myURL=r'http://www.imooc.com/u/6085318/courses'#个人课程的URL
result=opener.open(myURL).read()#读取个人课程页面
wfile=open(r'./1.html',r'wb')
wfile.write(result)
wfile.close()
print result
三、key的确定
每个网站的用户名和密码的name都是不一样的,所以需要审查元素来确定访问的网站的登录name
这样就实现的模拟登录慕课网,并扒下来个人课程的页面
下面是爬下来的本地页面
上一篇: Python 判断日期是一年中的第几天 (填空题)
下一篇: 深入浅出 Git