python数据分析与可视化(python数据分析项目报告)
而这个问题就正好涉及到了python的数据可视化了。
很多同学学习python的主要目的就是为了实现数据可视化。
而如何将我们的数据的特征更好的、更直观的展示出来,python给出了很多解决方案。
今天,我们黄帮主为大家整理了一些python数据可视化的库,用于帮助大家更系统地了解这些库的特点以及可视化效果是怎么样的。
接下来,我们一一为大家做介绍。
matplotlib
说到数据可视化库,第一时间想到的就是我们的老大哥,也是我们数据分析中主要讲的可视化库–matplotlib
matplotlib 是一个 python 的 2d绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。
通过 matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。
一般我们matplotlib画图会结合我们的numpy甚至pandas进行使用,通过numpy或者pandas存储数据,然后通过matplotlib将数据用图标的形式表现出来。
图例
安装
matplotlib的安装非常简单,甚至当你使用anaconda的时候,anaconda已经帮你预安装好了,
因为它是属于专门面向数据科学的anaconda的必备第三方库,和pandas以及numpy一样。
如果没有安装只需要进行 pip install matplotlib 即可。
「当然,还可以通过我们的数据分析课程学习matplotlib的使用哦。」
「我们的数据分析课程还有matplotlib的前置知识numpy和pandas进行数据读取处理。」
plotly
我们课程不只是介绍了matplotlib,我们还有一个专门的课程「数据可视化」介绍了另一些可视化的库的内容,其中最重要也是最常用的就是我们的–plotly
数据分析离不开数据可视化。我们常用的就是pandas,matplotlib。
而plotly 则是一款用来做数据分析和可视化的在线平台,功能非常强大,可以在线绘制很多相比matplotlib更加漂亮的图形。
我们的同事小凡也用plotly制作过动态地图。
小凡制作的动态地图
plotly还是支持在线编辑,以及多种语言python、javascript、matlab、r等许多api。使用plotly甚至可以画出很多媲美tableau的高质量图。
图例
而plotly最重要的一点就是,它可以实现交互:
甚至还可以画出很炫酷的数据可视化图:
以及这类中规中矩和matplotlib画的图片类似,但是可以交互甚至有tag的图片:
安装
plotly的安装也可以通过简单的 pip install plotly 即可。
tableau
tableau software致力于帮助人们查看并理解数据。
tableau 帮助任何人快速分析、可视化并分享信息。超过 42,000 家客户通过使用 tableau 在办公室或随时随地快速获得结果。
数以万计的用户使用 tableau public 在博客与网站中分享数据。
tableau公司将数据运算与美观的图表完美地嫁接在一起。它的程序很容易上手,各公司可以用它将大量数据拖放到数字“画布”上,转眼间就能创建好各种图表。
这一软件的理念是,界面上的数据越容易操控,公司对自己在所在业务领域里的所作所为到底是正确还是错误,就能了解得越透彻。
图例
可以看到 tableau 有一个非常完美的数据可视化集成,你甚至可以通过数据索引图标,也可以通过图表索引数据,一个近乎完美的数据可视化交互。
目前很多商业分析都是用 tableau 作为数据可视化的一个工具,基于它极致的数据可视化交互性能,以及完美的数据展示。
但是,它并不是基于编程或者说它是自己的一个需要付费的数据可视化平台,所以我们很多时候可以通过plotly去画出媲美的数据可视化交互。
「官方网站」tableau:https://www.tableau.com
bokeh
bokeh (bokeh.js) 是一个 python 交互式可视化库,支持现代化 web 浏览器,提供非常完美的展示功能。
bokeh 的目标是使用 d3.js 样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互功能。
boken 可以快速地创建交互式的绘图,仪表盘和数据应用。
图例
也可以画出类似 plotly 地通过数据可视化交互。
安装
bokeh的安装也是python的第三方库安装方式:pip install bokeh 即可。
「官方文档」bokeh:https://docs.bokeh.org/en/latest/#
pyecharts
pyecharts是一个将python与echarts结合的强大的数据可视化工具。
apache echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。
而 python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
pyecharts的特性
- 简洁的 api 设计,使用如丝滑般流畅,支持链式调用。
- 囊括了 30+ 种常见图表,应有尽有。
- 支持主流 notebook 环境,jupyter notebook 和 jupyterlab。
- 可轻松集成至 flask,sanic,django 等主流 web 框架。
- 高度灵活的配置项,可轻松搭配出精美的图表。
- 详细的文档和示例,帮助开发者更快地上手项目。
- 多达 400+ 地图文件,并且支持原生百度地图,为地理数据可视化提供强有力的支持。
图例
安装
1. pip 安装
安装 v1 以上版本
$ pip install pyecharts -u
如果需要安装 0.5.11 版本的开发者,可以使用
pip install pyecharts==0.5.11
2. 源码安装
安装 v1 以上版本
$ cd pyecharts
$ pip install -r requirements.txt
$ python setup.py install
seabor
seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。
同时seaborn也进行了更高级的api封装,从而使得作图更加容易。
在大多数情况下我们可以使用 seaborn 做出很具有吸引力的图,同时,我们也可以使用matplotlib就能制作具有更多特色的图。
关系上,seaborn可以视为matplotlib的补充,而不是替代物。seaborn有着能高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式的特点。
图例
安装
「安装」pip install seaborn
总结
今天盘点的python数据可视化库,同学们掌握了哪些?
数据可视化是数据分析得非常重要的一环,在我们的「数据分析」课程中,我们为了让大家更好的学习,推出了「数据可视化」课程作为补充。
在「数据可视化」课程中,我们主要以 「plotly」作为数据可视化的主要生产力。
当然,如果你不满足于「plotly」「matplotlib」等数据可视化方式,我们可以通过更多的比如说「bokeh」或者「pyecharts」的工具进行我们的数据可视化。