欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

如何用Python把网站上面的文档教程制作成PDF?不妨看看这篇文章

程序员文章站 2022-04-09 18:16:29
人生苦短,我用Python。这句话我仅仅只是说说而已,Python丰富的库,意味着Python写代码的效率比其他的编程语言高出好几倍。Python的应用领域也特别的广,比如:web开发、爬虫、自动化测试/运维、测试/运维开发、大数据、数据分析、人工智能、机器学习等等。如果你是想要爬取网上数据的话,那 ......
如何用Python把网站上面的文档教程制作成PDF?不妨看看这篇文章

 

人生苦短,我用python。这句话我仅仅只是说说而已,python丰富的库,意味着python写代码的效率比其他的编程语言高出好几倍。python的应用领域也特别的广,比如:web开发、爬虫、自动化测试/运维、测试/运维开发、大数据、数据分析、人工智能、机器学习等等。如果你是想要爬取网上数据的话,那肯定就是用python了呀,毕竟很强大。

如果你需要一个良好的学习交流环境,那么你可以考虑python学习交流群:548377875;

如果你需要一份系统的学习资料,那么你可以考虑python学习交流群:548377875。

学习python的朋友都知道"廖雪峰",也都会在上面看教程,但是总是用网页看感觉特别麻烦,今天小编就用python把"廖雪峰"的教程制作成pdf,这样离线也能可以看了!

如何用Python把网站上面的文档教程制作成PDF?不妨看看这篇文章

 

今天小编就是用python爬虫中最为常用的两个模块,也是爬虫的两大神器了

requests和beautifulsoup

首先咱们需要做的就是先安装这两个模块

  • pip install requests
  • pip install beautifulsoup

既然要把网页的html转换成pdf那么也要需要pdfkit这个模块的,和上面一样的安装方法。

接下来就是爬虫的基本的流程了

先在浏览器里面利用开发者工具(f12)找到正文的div标签,然后用requests获取整个页面数据,在用beautifulsoup提取正文内容。

简单明了

如何用Python把网站上面的文档教程制作成PDF?不妨看看这篇文章

 

左侧的目录也可以用同样的方法找到。

实现源码

如何用Python把网站上面的文档教程制作成PDF?不妨看看这篇文章

 

效果图

如何用Python把网站上面的文档教程制作成PDF?不妨看看这篇文章