欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python 爬取网页中JavaScript动态添加的内容(二)

程序员文章站 2022-03-20 20:00:40
使用 selenium + phantomjs 实现 1、准备环境 selenium(一个用于web应用程测试的工具)安装:pip install seleniumphantomjs(是一种*面的浏览器,用于完成网页的渲染)下载:http://phantomjs.org/download.html ......

使用 selenium + phantomjs 实现

1、准备环境

selenium(一个用于web应用程测试的工具)安装:pip install selenium
phantomjs(是一种*面的浏览器,用于完成网页的渲染)下载:

2、使用

from selenium import webdriver

url = 'http://jandan.net/ooxx'
driver = webdriver.phantomjs(
    executable_path='d:/software/phantomjs-2.1.1-windows/bin/phantomjs.exe')  # 如果没有配置phantomjs的环境变量,需要手动指定路径
driver.get(url)
print(driver.page_source)