欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python之爬虫简单原理

程序员文章站 2022-10-28 12:30:10
爬虫前凑: (1)明确目的 (2)找到数据对应的网页 (3)分析网页的结构找到数据所在的标签位置 (4)模拟HTTP请求,向服务器发送请求获取到服务器返回给我们的HTML (5)用正则表达式提取我们要的数据 (6)分析、精炼、展示、保存数据...

Python之最简单爬虫

前言:由于懒、没时间、也没啥技术也不太会表达,好久没写博客了,但一直听说Python有多厉害的,爬虫有多厉害的,而我没玩过,也不太清楚是个啥,搞得我很好奇,很早就想玩玩她了,所以最近学习了一下Python,还好由于我有一些JAVA的基础,感觉也不是很难,还是比较容易理解的,也算是入门了吧,话不多说,盘她~~

首先,解析下Python和爬虫(以我的理解,具体的请百度):

Python:一种开发语言,有点神奇,有点简单粗暴,基本语法类似于JAVA,C,C++吧!!!

爬虫:就是爬取网页等请求得到的数据,具体是请求网页URL得到网页的HTML,分析HTML,得到想要的数据,然后想干啥就干啥啦!!!

一、爬虫步骤:

(1)明确目的
(2)找到数据对应的网页
(3)分析网页的结构找到数据所在的标签位置
(4)模拟HTTP请求,向服务器发送请求获取到服务器返回给我们的HTML
(5)用正则表达式提取我们要的数据
(6)分析、精炼、展示

本文地址:https://blog.csdn.net/weixin_40914842/article/details/109062948

相关标签: Python