使用Python爬取网站数据分析
程序员文章站
2022-02-16 11:57:31
...
玩Chat分享有一段时间了,回过头来看看从数据爬取(如何用 Python 爬取网页制作电子书)、前后端(用 Kotlin 开发 SpringBoot 之 Data JPA、使用 Angular2+ 开发 Markdown 编辑器)、到开发语言(TypeScript 快速入门)都有涉及。但我们在分享一场 Chat 的时候,有没有思考过:
- 哪类 Chat 最受欢迎?
- 哪类 Chat 作者最多?
- 发布 Chat 最多的作者是谁?
- 收入最高的作者是谁?
- 最受欢迎的主题是什么?
- ……
现在深度学习取得了举世瞩目的发展,互联网上的数据就像是一个巨大的金矿,我说不出哪里有黄金,但是我知道哪里有铲子。今天,我们学习使用 Selenium 抓取页面数据,保存到 MongoDB 中,然后使用 PyNum、MatplotLib、Pandas 等工具进行数据的分析、处理、展示,尝试解决我们上面的疑问。
下一篇: (转)机器学习:偏差处理(2)