Python selenium

程序员文章站 2022-07-14 09:52:12

...

selenium

selenium 基于浏览器自动化的一个模块
便携的获取网站中动态加载的数据（Ajax）
便携实现模拟登录
Google浏览器
- 驱动程序下载路径
- 确定版本映射关系
实例化浏览器对象传入浏览器驱动程序
- bro = webdriver.Chrome(’./chromedriver.exe’)
编写自动操作代码
基于浏览器自动化的操作代码
- 发起请求：get(url)
- 标签定位: find系列方法
- 标签交互: send_keys('xxx)
- 执行js程序: excute_script(‘jsCode’)
- 前进，后退: back(),forward()
- 关闭浏览器: quit()
selenium 处理iframe
- 如果定位的标签是存在iframe标签之中的，则必须切换浏览器标签定位的作用域：
  - bro.switch_to.frame(‘frame’s id’)

seleniu 模拟登录

from selenium import webdriver
from time import sleep

if __name__ == '__main__':
    bro = webdriver.Chrome('./chromedriver.exe')
    bro.get('https://mail.qq.com/')
    bro.switch_to.frame('login_frame')
    user = bro.find_element_by_id('u')
    password = bro.find_element_by_id('p')
    sleep(1)
    user.send_keys('309519959')
    sleep(1)
    password.send_keys('562')
    sleep(1)
    log_btn = bro.find_element_by_id('login_button')
    log_btn.click()
    sleep(3)
    bro.quit()

动作链（拖动）:

from selenium.webdriver import ActionChains
from selenium import webdriver
from time import sleep
if __name__ == '__main__':
    # 实例化浏览器对象 传入浏览器驱动程序
    bro = webdriver.Chrome(executable_path='./chromedriver.exe')
    # 让浏览器发起一个指定url对应请求
    url = 'https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable'
    bro.get(url)
    #切换iframe
    bro.switch_to.frame('iframeResult')
    div = bro.find_element_by_id('draggable')
    #实例化动作链对象
    action = ActionChains(bro)
    #点击和长按
    action.click_and_hold(div)
    for i in range(5):
        #perform 立即执行动作链操作
        #move_by_offset(x,y) x水平，y竖直方向
        action.move_by_offset(17,0).perform()
        sleep(0.5)
    action.release()
    bro.quit()

无头浏览器

from selenium import webdriver
from time import sleep
#实现无可视化界面
from selenium.webdriver.chrome.options import Options
#实现规避检测
from selenium.webdriver import ChromeOptions

# #实现无可视化界面的操作
# chrome_options = Options()
# chrome_options.add_argument('--headless')
# chrome_options.add_argument('--disable-gpu')

#实现规避检测
option = ChromeOptions()
option.add_experimental_option('excludeSwitches',['enable-automation'])

option.add_argument('--headless')
option.add_argument('--disable-gpu')
# option.add_argument('--disable-gpu')

#实现让selenium规避被检测的风险
bro = webdriver.Chrome(executable_path='./chromedriver.exe',options=option)

#无可视化界面 phantomJs
bro.get('https://www.baidu.com')
print(bro.page_source)
sleep(3)
bro.quit()

github
https://www.cnblogs.com/w0000/p/15097695.html

Python selenium

selenium

Python中字典映射类型的学习教程

Python中列表和元组的相关语句和方法讲解

Python编程中装饰器的使用示例解析

剖析Python的Tornado框架中session支持的实现代码

Python中在for循环中嵌套使用if和else语句的技巧

Python编程中的异常处理教程

Python判断列表是否已排序的各种方法及其性能分析

python进程池内存一直上涨（python线程池内存耗尽）

Centos Python2 升级到Python3的简单实现

常见的python正则用法实例讲解