学习爬虫的第一天

程序员文章站 2022-05-06 19:16:11

爬虫是什么？网络就如同蜘蛛网，而数据相当于里面的节点，爬虫如同蜘蛛，通过节点去获取蜘蛛网上的内容，获取想要的数据信息获取网页数据方式： 1、浏览器访问——下载网页数据 2、模拟浏览器对网页进行访问——解析数据——将所需要的内容保存在本地其中第二种方式就是爬虫的整体流程首先先了解下关于网页必备 ......

爬虫是什么？

网络就如同蜘蛛网，而数据相当于里面的节点，爬虫如同蜘蛛，通过节点去获取蜘蛛网上的内容，获取想要的数据信息

获取网页数据方式：

1、浏览器访问——下载网页数据

2、模拟浏览器对网页进行访问——解析数据——将所需要的内容保存在本地

其中第二种方式就是爬虫的整体流程

首先先了解下关于网页必备知识

https和http的区别？

http：明文显示，端口号为80

https:进行加密，添加数字证书，端口号为443

网络请求方式

get

post

put

head

delete

patch

简单说下get和post区别

get请求：htpp默认的请求方式是get；

get请求的特点：

*没有请求体，携带数据保存在url后面

*get请求携带的参数必须在4k之内

*get请求的携带的数据由于封装在url后面，所以会暴露在浏览器地址栏中

post请求的特点：

*有请求体，数据保存在请求体中

*上传提交的数据可以无限大

*请求体中如果存在中文，会使用url编码！

第一次写博客，过程不太熟悉，望大神们多加指导2019-05-23

上一篇：李师师和燕青的故事到底是什么样的燕青又是怎么对待李师师的

下一篇： Linux相关

学习爬虫的第一天

总结python爬虫抓站的实用技巧

iOS内存管理中引用计数的学习

Vuejs学习笔记之使用指令v-model完成表单的数据双向绑定

学习强国怎么删除好友? 学习强国解除好友关系的教程

c#中的扩展方法学习笔记

c#爬虫爬取京东的商品信息

vue中的inject学习教程

Python中的with语句与上下文管理器学习总结

Java描述数据结构学习之链表的增删改查详解

深入学习Spring Boot排查 @Transactional 引起的 NullPointerException问题