如何使用matplotlib让你的数据更加生动
1 引言
matplotlib 是 python 中最受欢迎的数据可视化软件包之一,支持跨平台运行,它是 python 常用的 2d 绘图库,同时它也提供了一部分 3d 绘图接口。matplotlib 通常与 numpy、pandas 一起使用,是数据分析中不可或缺的重要工具之一。
本文就日常生活中常见的业务场景进行展开讨论,更详尽的说明可以参考文档。
2 折线图
折线图(line chart)是我们日常工作、学习中经常使用的一种图表,它可以直观的反映数据的变化趋势。
可视化结果:
直线:左上直线图形显示。曲线:右上带有样式变化和标记的折线预览。
代码如下:
def draw_line(): n = 8 t = np.linspace(0, 1, n) fig, (axa, axb) = plt.subplots(1, 2) # line axa.plot(t, t, marker = 'o') axa.set_title('line') # curve axb.plot(t, t, linestyle='--', marker='*',c='r', label='linear') axb.plot(t, t**2, linestyle='-.', marker='d',c='c', label='quadratic') axb.plot(t, t**3, linestyle=':', marker='^',c='y', label='cubic') axb.set_title('curve') plt.legend() plt.show()
函数说明:
plot([x], y, [fmt], data=none, **kwargs)
- 可选参数[fmt] 是一个字符串来定义图的基本属性如:颜色(color),点型(marker),线型(linestyle)
- 对于颜色 color=‘r' 代表red 表示红色;color=‘c' 代表cyan 表示蓝绿;color=‘y' 代表yellow表示黄色
- 对于线型 linestyle='–' 代表dashed line style 为虚线;linestyle='-.‘代表 dash-dot line style 为点画线; linestyle=':' 代表dotted line style 为点线
3 散点图
散点图用于在水平轴和垂直轴上绘制数据点,它表示了因变量随自变量变化的趋势。通俗地讲,它反映的是一个变量受另一个变量的影响程度。
可视化结果:
散点图:左上散点图可视化,带有颜色变化。气泡图:右上带有颜色变化和刻度的气泡图。
代码如下:
def draw_scatter(): n = 128 x = np.random.rand(n) y = np.random.rand(n) c = np.random.rand(n) s = np.random.rand(n) s = np.pi*(32*s)**2 cmapdisp = cm.get_cmap('rainbow') fig, (axa, axb) = plt.subplots(1, 2) # scatter axa.scatter(x, y, s=8,c=cmapdisp(c),alpha=0.75) axa.set_title('scatter') # bubble axb.scatter(x, y, c=cmapdisp(c), s=s, alpha=0.25, edgecolors='none') axb.set_title('bubble') plt.show()
函数说明:
scatter(x, y, s=none, c=none, marker=none, cmap=none, norm=none, vmin=none, vmax=none, alpha=none, linewidths=none, verts=none, edgecolors=none, *, data=none, **kwargs)
- x,y:表示的是大小为(n,)的数组,也就是我们即将绘制散点图的数据点
- s:是一个标量实数或者是一个数组大小为(n,),表示点的大小。
- c:表示的是颜色,是一个可选项。默认是蓝色'b',表示的是标记的颜色,或者可以是一个表示颜色的字符,或者是一个长度为n的表示颜色的序列等等
- marker:表示的是标记的样式,默认的是'o'。
- alpha:实数,0-1之间。点的透明度,透明度设置的好能够使图好看。
4 柱状图
柱状图是一种用矩形柱来表示数据分类的图表,柱状图可以垂直绘制,也可以水平绘制,它的高度与其所表示的数值成正比关系。柱状图显示了不同类别之间的比较关系,图表的水平轴 x 指定被比较的类别,垂直轴 y 则表示具体的类别值。
可视化结果:
柱状图:左上图形以组合在一起的平行柱状图显示。
堆叠柱状图:右上图形显示在堆叠的柱状图上。
代码如下:
def draw_bar(): n = 8 hx = np.random.randint(18, 65, size=n) mx = np.random.randint(18, 65, size=n) hs = np.random.randint(1, 5, size=n) ms = np.random.randint(1, 5, size=n) indice = np.arange(n) + 1 igrupos = ['g{}'.format(g) for g in indice] iidades = np.arange(0, 80, 5) larg = 0.25 fig, (axa, axb) = plt.subplots(1, 2) # bar axa.bar(indice - larg, hx, width=larg, yerr=hs,color='c', align='edge', label='man') axa.bar(indice, mx, width=larg, yerr=ms, color='r', align='edge', label='women') axa.set_title('bar') axa.set_xticks(indice) axa.set_yticks(iidades) axa.set_xticklabels(igrupos) axa.legend() # barras axb.bar(indice, hx, color='c', label='man', yerr=hs) axb.bar(indice, mx, color='r', bottom=hx, label='women', yerr=ms) axb.set_title('barras ') axb.set_xticks(indice) axb.set_xticklabels(igrupos) axb.set_yticks(iidades*2) axb.legend() plt.show()
函数说明:
bar(x, height, width, bottom, align)
- x :一个标量序列,代表柱状图的x坐标,默认x取值是每个柱状图所在的中点位置,或者也可以是柱状图左侧边缘位置。
- height: 一个标量或者是标量序列,代表柱状图的高度。
- width: 可选参数,标量或类数组,柱状图的默认宽度值为 0.8。
- bottom: 可选参数,标量或类数组,柱状图的y坐标默认为none。
- algin: 有两个可选项 {“center”,“edge”},默认为 ‘center',该参数决定 x 值位于柱状图的位置。
- bottom: 该参数可以指定柱状图开始堆叠的起始值,一般从底部柱状图的最大值开始,依次类推
- yerr: 可选参数, 这里针对垂直型误差,以误差棒的形式显示
5 饼状图
饼状图用来显示一个数据系列,具体来说,饼状图显示一个数据系列中各项目的占项目总和的百分比。
可视化结果:
饼图:左上玫瑰图显示两层信息(外层标签和内层比例分布)。
雷达图:右上雷达图形显示,具有基于中心的值和基于径向的变化。
代码如下:
def test_pie(): etiqueta = list('abcdefghijkl') m, n = 128, len(etiqueta) valor = np.random.random(n)*0.9 + 0.1 var = np.random.random(m) # param cmapradial = cm.get_cmap('magma') theta = 2*np.pi*np.arange(n)/n omega = 2*np.pi*np.arange(m)/m valor_ = np.append(valor, [valor[0]]) var_ = np.append(var, [var[0]]) theta_ = np.append(theta, [theta[0]]) omega_ = np.append(omega, [omega[0]]) raio = 1.25 mult = 0.15 # draw fig = plt.figure() axa = fig.add_subplot(121, aspect='equal') axb = fig.add_subplot(122, projection='polar') # pizza axa.pie(valor, labels=etiqueta, pctdistance=0.9,autopct='%1.1f%%', radius=1.1) axa.pie(var, radius=0.9, colors=cmapradial(var)) axa.set_title('pizza') centro = plt.circle((0,0), 0.75, fc='white') axa.add_patch(centro) # radar axb.plot(theta_, valor_, marker='o', color='black', label='variable') axb.fill_between(theta_, 0, valor_, facecolor='black', alpha=0.25) axb.plot(omega_, raio + var_*mult, color='y', label='change') axb.plot(omega_, raio - var_*mult, color='y') axb.fill_between(omega_, raio - var_*mult, raio + var_*mult,facecolor='y', alpha=0.25) axb.set_title('radar') axb.set_xticks(theta) axb.set_xticklabels(etiqueta) axb.set_rticks(np.linspace(0, 1.5, 7)) axb.legend() plt.show()
函数说明:
pie(x, labels=none, colors=none, autopct=none, pctdistance=0.6, labeldistance=1.1, radius=none)
- x: 数组序列,数组元素对应扇形区域的数量大小。
- labels: 列表字符串序列,为每个扇形区域备注一个标签名字。
- color : 为每个扇形区域设置颜色,默认按照颜色周期自动设置。
- autopct :控制饼图内百分比设置,可以使用format字符串或者format function
'%1.1f'指小数点前后位数(没有用空格补齐) - labeldistance :label标记的绘制位置,相对于半径的比例,默认值为1.1, 如<1则绘制在饼图内侧;
- pctdistance :类似于labeldistance,指定autopct的位置刻度,默认值为0.6;
- radius :控制饼图半径,默认值为1;
6 总结
本文详细地介绍了使用matplotlib画折线图、散点图、饼状图以及柱状图的样例,并给出了相关可视化效果。
到此这篇关于如何使用matplotlib让你的数据更加生动的文章就介绍到这了,更多相关matplotlib数据更生动内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!