欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python模拟登陆网站的示例

程序员文章站 2022-04-12 23:48:10
使用已有cookie登陆使用浏览器登陆,获取浏览器中的cookie信息,来进行登陆。我们以博客园为例,先登录博客园账号。我们访问随笔列表,在控制台我们可以看到我们登陆后浏览器的cookie剔除一些数据...

使用已有cookie登陆

使用浏览器登陆,获取浏览器中的cookie信息,来进行登陆。

我们以博客园为例,先登录博客园账号。我们访问随笔列表,在控制台我们可以看到我们登陆后浏览器的cookie

python模拟登陆网站的示例

剔除一些数据统计及分析的cookie,剩下的就是登陆可能需要的.cnblogscookie和.cnblogs.aspnetcore.cookies

# _ga google分析 cookie
# um_distinctid 友盟cookie
# cnzzxxx cnzzcookie
# __utma,__utmc,__utmz google统计网站
# hm_lvt_xxx 百度统计网站
import urllib.request

url = 'https://i.cnblogs.com/posts'

user_agent = 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/77.0.3865.90 safari/537.36'

#浏览器登录后得到的cookie,也就是刚才复制的字符串
cookie_str = '.cnblogscookie=xxx; .cnblogs.aspnetcore.cookies=xxx'

headers = {
 'user-agent': user_agent,
 'cookie':cookie_str
}

req = urllib.request.request(url,headers=headers)
resp = urllib.request.urlopen(req).read().decode('utf-8')

print(resp)

python模拟登陆网站的示例

登陆获取cookie

登陆的表单一般是使用的form data,现在也有些表单使用request payload使用json格式传参。

form data如药智网

python模拟登陆网站的示例

request payload如博客园

python模拟登陆网站的示例

form data

博客园的登陆需要拖动验证所以略过。我们以药智网为例,我们打开控制台可以看到登陆需要传的表单参数,这里是使用的form data表单。我们模拟登陆后获取到登陆后的cookie,然后访问登录后的个人中心页面。

python模拟登陆网站的示例

import urllib.request
import http.cookiejar

url = 'https://www.yaozh.com/login'

user_agent = 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/77.0.3865.90 safari/537.36'

# formdata数据
data = {'username': '用户名',
  'pwd': '密码',
  'formhash': 'c3086bba84',
  'backurl': 'https%3a%2f%2fwww.yaozh.com%2f'}

post_data = urllib.parse.urlencode(data).encode('utf-8')

# 请求头设置
headers = {
 'user-agent': user_agent
}

# 构造登陆请求
req = urllib.request.request(url, headers=headers, data=post_data)

# cookie
cookie = http.cookiejar.cookiejar()

# 构造一个opener携带登录后的cookie
opener = urllib.request.build_opener(urllib.request.httpcookieprocessor(cookie))

# 发送登陆请求
resp = opener.open(req)

print(resp)

# 登录后个人中心
url = 'https://www.yaozh.com/member/'

# 构造访问请求
req = urllib.request.request(url, headers=headers)

resp = opener.open(req).read().decode('utf-8')

print(resp)

python模拟登陆网站的示例

request payload

如果登陆需要request payload我们需要将参数转为json字符串并在头部设置content-type

import json
...

data = {'logintype': '1',
  'pwdorverifycode': '密码',
  'useridentification': '账号',
  'uatoken': '',
  'webumidtoken':''}

headers = {
 'content-type': 'application/json;charset=utf-8',
 'user-agent': user_agent
}


req = urllib.request.request(url, headers=headers, data=json.dumps(data))
...

登陆后用session保持登陆状态

我们用requests模块的session对象来保存回话信息

import requests

url = 'https://www.yaozh.com/login'

user_agent = 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/77.0.3865.90 safari/537.36'

# formdata数据
data = {'username': 'chenjy1225',
  'pwd': '19931225yjy',
  'formhash': 'c3086bba84',
  'backurl': 'https%3a%2f%2fwww.yaozh.com%2f'}


#构造session
session = requests.session()

# 发送post请求
resp = session.post(url, data)

# 登录后个人中心
url = 'https://www.yaozh.com/member/'

# 发送请求访问个人中心
resp = session.get(url).content.decode('utf-8')

print(resp)

python模拟登陆网站的示例

调用浏览器登陆

我们也可以在程序中调用一个浏览器来访问登陆网站。在python中使用selenium库就能轻松实现调用浏览器,被控制的浏览器可以是chrome、firefox等。
以前较常用的还是phantomjs但是phantomjs被python弃用了。

userwarning: selenium support for phantomjs has been deprecated, please use headless versions of chrome or firefox instead
warnings.warn('selenium support for phantomjs has been deprecated, please use headless '

chrome对应的chromedriver

1.下载selenium、firefox浏览器及firefox驱动。

2.将下载的firefox驱动geckodriver放在firefox浏览器安装目录

3.将firefox浏览器安装目录添加到path中

4.重启ide

我们找到需要登陆时候输入的元素id及登陆button id。

python模拟登陆网站的示例

from selenium import webdriver
import time

# 新建selenium浏览器对象,后面是geckodriver.exe下载后本地路径
browser = webdriver.firefox()

url = 'https://www.yaozh.com/login'

# 浏览器访问登录页面
browser.get(url)

# 等待3s用于加载脚本文件
browser.implicitly_wait(3)

# 输入用户名
username = browser.find_element_by_id('username')
username.send_keys('chenjy1225')

# 输入密码
password = browser.find_element_by_id('pwd')
password.send_keys('19931225yjy')

# 点击登录按钮
login_button = browser.find_element_by_id('button')
login_button.submit()

# 网页截图
browser.save_screenshot('screenshot.png')

# 强制等待5s,等待登录后的跳转
time.sleep(5)

url = 'https://www.yaozh.com/member/'

browser.get(url)

# 网页截图个人中心
browser.save_screenshot('screenshot1.png')

# 关闭浏览器
browser.quit()

screenshot.png:

python模拟登陆网站的示例

screenshot1.png:

python模拟登陆网站的示例

以上就是python模拟登陆网站的示例的详细内容,更多关于python模拟登陆网站的资料请关注其它相关文章!