欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python3 Post登录并且保存cookie登录其他页面的方法

程序员文章站 2022-09-04 14:59:56
如下所示: import urllib.request import sys import http.cookiejar import urllib.par...

如下所示:

import urllib.request
import sys
import http.cookiejar
import urllib.parse
from bs4 import beautifulsoup
import codecs
import re

#登录页面
url = "http://www.abc.com/login.asp"
#登录post数据
postdata =urllib.parse.urlencode({ 
"username":"abc",
"password":"abc"
 }).encode('utf-8')
#构造header
header = {
 "accept":"text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
 "accept-encoding":"utf-8",
 "accept-language":"zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3",
 "connection":"keep-alive",
 "host":"www.abc.com",
 "referer":"http://www.abc.com/login.asp",
 "user-agent":"mozilla/5.0 (windows nt 6.1; wow64; rv:32.0) gecko/20100101 firefox/32.0"
 }


req = urllib.request.request(url,postdata,header)
#获得cookie
cj = http.cookiejar.cookiejar()
opener=urllib.request.build_opener(urllib.request.httpcookieprocessor(cj))
r = opener.open(req)

#继续访问登陆后的页面

get_url = 'http://www.abc.com/user/' 
get_request = urllib.request.request(get_url, headers=header)
get_response = opener.open(get_request)
#打印获得的页面信息
print(get_response.read().decode("utf-8"))
#用bs4可以获得你需要的标签内容
soup = beautifulsoup(get_response.read(),"html.parser")
jie = soup.find_all('span')
#这里利用正则表达式过滤掉html语言
dr = re.compile(r'<[^>]+>',re.s)
#这里jie[2]表示取符合条件的第三个标签
dd = dr.sub('',str(jie[2]))
print(dd)

以上这篇python3 post登录并且保存cookie登录其他页面的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。