爬虫学习-异常捕获

程序员文章站 2022-05-29 21:02:42

...

爬虫相关的异常一般分为两类，一类是URLError，另一类是HTTPError。

1.URLError

#导入相关包
from urllib import request, error
#通过try catch捕获相关异常 网址中忘记了//
try:
    response = request.urlopen('http:www.baidu.com',timeout=5)
except error.URLError as e:
    print(e.reason)

相应的报错信息如下：no host given

2.HTTPError 其实HTTPError是URLError的子类专门用来处理HTTP请求的错误。

#导入包
from urllib import request,error
#try会发现不存在网页的错误(404)，并且会被捕获
try:
    response = request.urlopen('https://blog.csdn.net/1.html')
except error.HTTPError as e:
    print(e.reason, e.code, e.headers)
except error.URLError as e:
    print(e.reason)
else:
    print('访问成功！')

访问的页面不存在会首先被HTTPError捕获，其它异常会被URLError捕获

相关标签：爬虫 python URLError HTTPError

上一篇：调用图灵机器人api2.0

下一篇： Python每日一练(4)-成语填填乐

爬虫学习-异常捕获

Java异常学习之自定义异常详解

C#程序异常关闭时的捕获

C# WinForm捕获未处理的异常实例解析

Python中的异常处理相关语句基础学习笔记

Python的爬虫程序编写框架Scrapy入门学习教程

Android编程实现捕获程序异常退出时的错误log信息功能详解

零基础写python爬虫之HTTP异常处理

C#程序异常关闭时的捕获

Python学习笔记之读取文件、OS模块、异常处理、with as语法示例

Java异常学习之自定义异常详解