python 爬虫系列（一）网站获取

程序员文章站 2022-04-08 23:18:51

...

爬虫是python的一个强大的功能，它的核心在于获取页面数据和反馈给该网站相应的数据以获取一定的权限。

其中以抓取页面信息为核心功能。

将页面html信息提取出来的功能主要如下：

一、获取header，url

二、根据header和url获取html

三、对html内容进行编译，就可以看到网址的源码和数据了

import requests
from bs4 import BeautifulSoup

url = 'https://item.jd.com/12235139.html'
header = {'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36"}
html = requests.get(url,headers = header)
soup_first = BeautifulSoup(html.text,'lxml')

print(soup_first)

相关标签： python 爬虫 python 爬虫

上一篇： Setting Up a Capture Session（swift之AVCaptureSession AVCaptureDevice AVFoundation）

下一篇：微软允许员工永久在家办公，远程办公时代真的要来临了吗？

python 爬虫系列（一）网站获取

python3通过selenium爬虫获取到dj商品的实例代码

如何使用Python爬虫获取offcn上的公考信息及写入Excel表格并发送至指定邮箱

那些年我们在python掉进的坑系列之一pandas的to_sql

Python爬虫实例爬取网站搞笑段子

python实现爬虫统计学校BBS男女比例（一）

2019基于python的网络爬虫系列，爬取糗事百科

python爬虫系列Selenium定向爬取虎扑篮球图片详解

每天一道Python面试题（系列）

python 通过类中一个方法获取另一个方法变量的实例

一则python3的简单爬虫代码

python 爬虫系列（一） 网站获取

python3通过selenium爬虫获取到dj商品的实例代码

如何使用Python爬虫获取offcn上的公考信息及写入Excel表格并发送至指定邮箱

那些年我们在python掉进的坑系列之一pandas的to_sql

Python爬虫实例爬取网站搞笑段子

python实现爬虫统计学校BBS男女比例（一）

2019基于python的网络爬虫系列，爬取糗事百科

python爬虫系列Selenium定向爬取虎扑篮球图片详解

每天一道Python面试题（系列）

python 通过类中一个方法获取另一个方法变量的实例

一则python3的简单爬虫代码

python 爬虫系列（一）网站获取