欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python-模拟浏览器-下载文献

程序员文章站 2022-03-07 20:03:38
...

1.安装Python(注意添加环境变量(Path))
2.安装Pycharm(Python编译环境)
3.安装Chrom浏览器
4.网上下载Chrom浏览器对应的ChromDriver.exe放置到Python的安装目录下。
5.安装Splinter包(网上下载,解压后定位路径使用cmd采用python Setup.py install进行安装)

Pycharm运行代码如下:(简易程序,循环条件不控制) 只点击全选和下一页

#!usr/bin/env python
# -*- coding:utf-8 -*-

import time
from splinter import Browser
from selenium import webdriver
#driver = webdriver.Chrome()
#driver.maximize_window()
#用splinter自动操作浏览器
url = "Web Of Science URL" #80图书馆账号提前登陆
web_browser = Browser("chrome")
web_browser.visit(url)
time.sleep(5);

i=1;
while i<500:   #‘500’根据浏览器实际需要点击下一页的次数决定,和检索结果有关
    time.sleep(3);
    web_browser.find_by_id('SelectPageChkId').click();
    time.sleep(3);
    str = web_browser.find_by_css('span.icon-number-messages').text
    print(i, str); #输出当前页面和已经选择的条数
    web_browser.find_by_css('a.paginationNext.snowplow-navigation-nextpage-top').click();
    time.sleep(30); #修改点击下一页之前的时间,当前为30S,经过实际测试比较稳定
    i += 1;


#下面是Splinter定位浏览器对象的方法
#time.sleep(1)
#web_browser.find_by_id("J-login").click()
#web_browser.fill("wd",u"猫")
#web_browser.find_by_id("su").click()
#time.sleep(3)
#web_browser.find_by_name("wd").fill(u"美女")
#web_browser.find_by_id("su").click()
#time.sleep(5)
#web_browser.quit()

记录于 2019.10.21

相关标签: Python自动化