欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python数据分析matplotlib可视化之绘图

程序员文章站 2022-04-28 10:28:40
Matplotlib是一个基于python的2D画图库,能够用python脚本方便的画出折线图,直方图,功率谱图,散点图等常用图表,而且语法简单。 Python中通过matplotlib模块的pyplot子库来完成绘图。Matplotlib可用于创建高质量的图表和图形,也可以用于绘制和可视化结果。m ......

         matplotlib是一个基于python的2d画图库,能够用python脚本方便的画出折线图,直方图,功率谱图,散点图等常用图表,而且语法简单。

        python中通过matplotlib模块的pyplot子库来完成绘图。matplotlib可用于创建高质量的图表和图形,也可以用于绘制和可视化结果。matplotlib是python优秀的数据可视化第三方库matplotlb.pyplot是绘制种类可视化图形的命令子库,相当于快捷方式 import matplotlib.pyplot as plt.

  1. 线形图:

   线性图是最基本的图表类型,常用于绘制连续的数据。通过绘制线形图,可以表现出数据的一种趋势变化。

matplotlib的plot(x,y)用来绘制线形图,在参数中传入x和y的坐标即可。其中,x和y轴坐标的数据格式可以是列表、数组和series.

1:坐标数据格式为series

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

data={'name':['tom','peter','lucy','max'],

      'sex':['female','female','male','male'],

      'math':[78,79,83,92],

       'city':['北京','上海','广州','北京']

       }

df=pd.dataframe(data)

print(df)

              #dataframe数据的行索引作为x轴,math列索引作为y轴

plt.plot(df.index,df['math'],color='red',linestyle='-',linewidth=3,marker='d')

 #通过plot函数的color参数可以指定线条的颜色,

linestyle参数可以指定线条的形状,

linewidth参数可指定线条的宽度,

marker参数可对坐标点进行标记(默认情况下,坐标点是没有标记的)

 #结果:

       name   sex   math  city        #创建一个dataframe数据

0    tom  female    78   北京

1  peter  female    79   上海

2   lucy    male    83   广州

3    max    male    92   北京

绘制的线性图:

                                 Python数据分析matplotlib可视化之绘图

 注意:颜色设置要放在线条和点的样式的前面,颜色、线条和点的样式可以放置于格式字符串。

:plt.plot(df.index,df['math'],'co-')  运行结果如下:

                                                                 Python数据分析matplotlib可视化之绘图

2. 柱状图

2.1  绘制柱状图主要是使用matplotlibbar函数:

bar函数的color参数可以设置柱状图的填充颜色,

alpha参数可以设置透明度,

例如:import matplotlib.pyplot as plt

data=[23,85,72,43,52]

plt.bar([1,2,3,4,5],data,color='royalblue',alpha=0.7)   #运行结果:

                                                      Python数据分析matplotlib可视化之绘图

bottom参数用于设置柱状图的高度,以此绘制堆积柱状图;

 width参数 用于设置柱状图的宽度,以此可以绘制并列柱状图

 grid函数用于绘制格网,通过对参数的个性化设置,可以绘制出个性的格网

 例如:

 import numpy as np

 import matplotlib.pyplot as plt

 data1=[23,85,72,43,52]

 data2=[42,35,21,16,9]

 width=0.3

 plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7,width=width)

 plt.bar(np.arange(len(data2))+width,data2,color='green',alpha=0.7,width=width)

 plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)  

#运行结果:

                Python数据分析matplotlib可视化之绘图

bar函数的通过barh函数可以绘制水平柱状图

 import numpy as np

 import matplotlib.pyplot as plt

 data1=[23,85,72,43,52]

 plt.barh(np.arange(len(data1)),data1,color='green',alpha=0.5)   #如图所示:

                                                                Python数据分析matplotlib可视化之绘图

2.2 刻度与标签:

 现实中的柱状图的x轴是有刻度标签的,上述实例中未设置。在matplotlib中,

 通过xticks函数 设置图标的x轴的刻度和刻度标签,yticks函数设置y轴的刻度和标签。

 通过xlabel ylabel 方法给x轴和y轴添加标签,

 通过title方法为图表添加标题

 例如:

 import numpy as np

 import matplotlib.pyplot as plt

 data1=[23,85,72,43,52]

 labels=['a','b','c','d','e']

 plt.xticks(range(len(data1)),labels)                #设置刻度和标签

 plt.xlabel('class')      #plt.xlabel、ylabel、title方法分别给x轴和y轴,图标题添加标签。

 plt.ylabel('amounts')

 plt.title('example')

 #plt.bar(range(len(data1)),data)

 plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7)

 plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)

#运行结果:

2.3 图例:               Python数据分析matplotlib可视化之绘图

图例是标识图表元素的重要工具,bar函数中传入label参数表示图例名称,通过legend函数即可绘制出图例

data1=[23,85,72,43,52]

data2=[42,35,21,16,9]

width=0.3

plt.bar(np.arange(len(data1)),data1,width=width,label='one')

plt.bar(np.arange(len(data2))+width,data2,width=width,label='two')

plt.legend()    #结果图:

                                        Python数据分析matplotlib可视化之绘图

2.4 文本注解:

例如:在柱状图中加入文本数字,可以很清楚的知道每个类别的数量。通过text函数可以在指定的坐标(x,y)上加入文本注释

data=[23,85,72,43,52]

labels=['a','b','c','d','e']

plt.xticks(range(len(data)),labels)         #设置刻度和标签

plt.xlabel('class')                      

plt.ylabel('amounts')

plt.title('example')

plt.bar(range(len(data)),data)

for x,y in zip(range(len(data)),data):

plt.text(x,y,y,ha='center',va='bottom')         #文本注解  # 第一个参数是x轴坐标

                                                                 # 第二个参数是y轴坐标

                                                               # 第三个参数是要显式的内容

                                 Python数据分析matplotlib可视化之绘图

3.散点图:

 matpltlibscatter函数可以用来绘制散点图,传入xy轴坐标。scatter(x,y)

利用numpy创建一组随机数

import numpy as np

import matplotlib.pyplot as plt

x=np.random.randn(100)

y=np.random.randn(100)

plt.scatter(x,y,color='red',marker='d')

#散点图:

                                                                      Python数据分析matplotlib可视化之绘图

 4. 直方图

matplotlibhist()函数用来绘制直方图。

直方图与条形图的区别:

直方图是用面积表示各频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其宽度与高度均有意义;

条形图(柱状图)是用条形的长度表示各类频数的多少,其宽度是固定的。

由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图是分开排列;条形图主要是用于展示分类数据,而直方图则主要用于展示数据型数据。

x=np.random.normal(size=100)

plt.hist(x,bins=30)

                                                                Python数据分析matplotlib可视化之绘图

5. 自定义设置

 matplotlib的图像位于figure对象中,通过figure函数可以创建一个新的figure,用于绘制图表

fig=plt.figure(figsize=(10,6))     #figsize参数可以设置图表(整个图)的长宽比

ax1=fig.add_subplot(2,2,1)

ax2=fig.add_subplot(2,2,2)    #在创建figure对象过程中,通过add_subplot函数创建子图,用于绘制图形

ax3=fig.add_subplot(2,2,3)

years=[1950,1960,1970,1980,1990,2000,2010]

gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]

ax1.scatter(years,gdp)     #选用不同的ax变量,则可以在对应的subplot子图中绘图(散点图、线形图、柱状图)

ax2.plot(years,gdp)

ax3.bar(years,gdp)

                                                             Python数据分析matplotlib可视化之绘图

#plt.subplots可以轻松的创建子图,而axes的索引类型类似于二维数组,这样就可以对指定的子图进行绘制

fig,axes=plt.subplots(2,2,figsize=(10,6))      

axes[1,0].plot(years,gdp)

axes[0,0].scatter(years,gdp)

axes[0,1].bar(years,gdp)

axes[1,1].hist(years,gdp)

                                                          Python数据分析matplotlib可视化之绘图

  注意:当没有设置figsize时,创建多子图会显得拥挤。通过plt..subplot_adjust方法可以设置子图的间距修改子图之间的间距

subplots__adjust(left=none,bottom=none,right=none,top=none,wspace=none,hspace=none) ,其中前4个参数用于设置subplot子图的外围边距,wspacehapace参数设置用于设置subplot子图间的边距。 

fig,axes=plt.subplots(2,2)    #未设置figsize时,默认情况下,各sudplot子图间都会留有一定的间距。

                                                             Python数据分析matplotlib可视化之绘图

years=[1950,1960,1970,1980,1990,2000,2010]

gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]

fig,axes=plt.subplots(2,2)

plt.subplots_adjust(wspace=0.3,hspace=0.3)

axes[1,0].plot(years,gdp)

axes[0,0].scatter(years,gdp)

axes[0,1].bar(years,gdp)

axes[1,1].hist(years,gdp)

                                                            Python数据分析matplotlib可视化之绘图

6. 样式与字体:

matplotlib自带了一些样式供用户使用,如常用的ggplot样式,通过plt.style.use('ggplot') 函数即可调用该样式绘图。

matplotlib默认为英文字体,如果绘制中出现汉字就会乱码,因此需要指定matplotlib的默认字体,这样就可以解决乱码的问题,

plt.rcparams['font.sans-serif']=['simhei']         #指定默认字体

plt.rcparams['axes.unicode_minus']=false        #解决保存图像时负号‘-’显示为方块的问题

                                                                       Python数据分析matplotlib可视化之绘图