欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

数据分析之matplotlib.pyplot模块

程序员文章站 2022-05-14 09:49:12
首先都得导模块。 一、绘制单线图 1,直线图 2,抛物线 3,正弦图 这里得到图形取决于x跟y的关系 二、绘制多个曲线的图 1,连续调用多次plot函数 2,也可以在一个plot函数中传入多对x,y值 3,将多个曲线绘制在一个table区域中:对象形式创建表图 三、plt的一些样式设置 1,设置网格 ......

  首先都得导模块。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pandas import series,dataframe

  一、绘制单线图

  1,直线图

x=[1,2,3,4,5]
y=[2,4,6,8,10]
plt.plot(x,y)

数据分析之matplotlib.pyplot模块

  2,抛物线

x = np.arange(-np.pi,np.pi,0.2)
y = x**2
plt.plot(x,y)

数据分析之matplotlib.pyplot模块

  3,正弦图

x = np.arange(-np.pi,np.pi,0.2)
y = np.cos(x)
plt.plot(x,y)

数据分析之matplotlib.pyplot模块

  这里得到图形取决于x跟y的关系

  二、绘制多个曲线的图

  1,连续调用多次plot函数

plt.plot(x,y)
plt.plot(x+3,y+3)

数据分析之matplotlib.pyplot模块

  2,也可以在一个plot函数中传入多对x,y值

plt.plot(x,y,x+10,y+10)

数据分析之matplotlib.pyplot模块

  3,将多个曲线绘制在一个table区域中:对象形式创建表图

a=plt.subplot(row,col,loc)创建曲线图对象
a.plot(x,y)
ax1 = plt.subplot(2,2,1)
ax1.plot(x,y)
ax1.grid()
ax2 = plt.subplot(2,2,2)
ax2.plot(x,y)
ax3 = plt.subplot(2,2,3)
ax3.plot(x,y)
ax4 = plt.subplot(2,2,4)
ax4.plot(x,y)

数据分析之matplotlib.pyplot模块

  三、plt的一些样式设置

  1,设置网格线,plt.grid()

参数:
axis:控制方向
color:支持十六进制颜色
linestyle:线的形状
alpha:透明度

plt.grid(axis='both')
plt.plot(x,y)

数据分析之matplotlib.pyplot模块

  2,坐标轴界限

axis方法设置x,y轴刻度值的范围
plt.axis([xmin,xmax,ymin,ymax])

plt.axis([-6,6,-2,2])
plt.plot(x,y)

数据分析之matplotlib.pyplot模块

  通过设置plt.axis('off')可以把坐标轴刻度给关闭,我们就只会看到图,而看不到刻度

  3,设置画布比例

plt.figure(figsize=(a,b)) a:x刻度比例 b:y刻度比例 (2:1)表示x刻度显示为y刻度显示的2倍

plt.figure(figsize=(8,18))
plt.plot(x,y)

  4,设置x轴,y轴,图片的名称

plt.xlabel('xxx')
plt.ylabel('yyy')
plt.title('ttt')
plt.plot(x,y)

数据分析之matplotlib.pyplot模块

  5,设置图例

  5.1 分别在plot函数中添加label参数,在调用plt.legend()方法显示

plt.plot(x,y,label='aaa')
plt.plot(x+3,y+3,label='bbb')
plt.legend()

  5.2 直接在legend()方法中传入字符串列表

plt.plot(x,y,x+3,y+3)
plt.legend(['aaa','bbb'])

数据分析之matplotlib.pyplot模块

  5.3 还可以设置legend()方法的参数调整图例的位置和显示样式

loc参数用于设置图例标签的位置,一般在legend函数内

数据分析之matplotlib.pyplot模块

ncol控制图例中有几列,在legend中设置ncol
plt.plot(x,y,x+3,y+3)
plt.legend(['aaa','bbb'],loc=3,ncol=2)

数据分析之matplotlib.pyplot模块

  6,保存图片

使用figure对象的savefig函数来保存图片
fig = plt.figure()---必须放置在绘图操作之前
figure.savefig的参数选项
filename:含有文件路径的字符串或python的文件型对象。图像格式由文件扩展名推断得出,例如,.pdf推断出pdf,.png推断出png (“png”、“pdf”、“svg”、“ps”、“eps”……)
dpi:图像分辨率(每英寸点数),默认为100
facecolor ,打开保存图片查看 图像的背景色,默认为“w”(白色)

fig = plt.figure()
plt.plot(x,y,x+3,y+3)
plt.legend(['aaa','bbb'],loc=3,ncol=2)
fig.savefig('./img.png',dpi=500)

  四、plot的参数设置

color或c:颜色,如‘r’或‘red’红色,‘g’绿色;也可以是十六进制,如'#eeefff';还可以rgb元祖,(0.2,0.3,0.4),值只能是0到1
alpha透明度
参数linestyle或ls线型
参数linewidth或lw线宽
marker点型
markersize点的大小

  五、直方图

是一个特殊的柱状图,又叫做密度图。
【直方图的参数只有一个x!!!不像条形图需要传入x,y】
plt.hist()的参数
bins  :直方图的柱数,可选项,默认为10
color  :指定直方图的颜色。可以是单一颜色值或颜色的序列。如果指定了多个数据集合,例如dataframe对象,颜色序列将会设置为相同的顺序。如果未指定,将会使用一个默认的线条颜色
orientation  :通过设置orientation为horizontal创建水平直方图。默认值为vertical
data=[1,2,3,2,3,1,4,5,2,2]
plt.hist(data,bins=10)   #data数据时1到5,所以它会把1到5之间分成11个区域,把每个区域所包含数据的个数给统计出来

数据分析之matplotlib.pyplot模块

  六、条形图

- 参数:第一个参数是索引。第二个参数是数据值。第三个参数是条形的宽度
- width 纵向设置条形宽度
- height 横向设置条形高度
bar()纵向、barh()横向
data1=[2,4,1,5]
data2=[3,5,1,6]
plt.bar(data1,data2)

数据分析之matplotlib.pyplot模块

plt.barh(data1,data2)

数据分析之matplotlib.pyplot模块

  七、饼图

  饼图主要有两种,取决于第一个数据参数,首先数据的是一个列表,但列表中出现整数时,每块占比等于自身值除以所有值总和,这种情况下占比总和为1;当每个值都是0到1之间,而且总和小于等于1,那么每个的占比就是自身值,这种情况下,占比总和就不一定为1了。

  1,占比总和肯定为1的

plt.pie([2,4,6])   #表示的是2占12的比例,4占12的比例,6占12的比例

数据分析之matplotlib.pyplot模块

  2,占比总和不一定为1的

plt.pie([0.2,0.4,0.1])#表示0.1占10%,0.2占20%,0.4占40%

数据分析之matplotlib.pyplot模块

  3,属性设置

饼图阴影、分裂等属性设置
#labels参数设置每一块的标签;
#labeldistance参数设置标签距离圆心的距离(比例值)
#autopct参数设置比例值小数保留位(%.3f%%);
#pctdistance参数设置比例值文字距离圆心的距离
#explode参数设置每一块顶点距圆心的长度(比例值,列表);
#colors参数设置每一块的颜色(列表);
#shadow参数为布尔值,设置是否绘制阴影
#startangle参数设置饼图起始角度

  3.1 给每一块设置标签

arr=[2,4,6]
plt.pie(arr,labels=['a','b','c'])

数据分析之matplotlib.pyplot模块

  3.2 给标签设置离中心的距离

arr=[2,4,6]
plt.pie(arr,labels=['a','b','c'],labeldistance=0.5)

数据分析之matplotlib.pyplot模块

  3.3 数值表示每块的占比,并设置占比离中心的距离

arr=[2,4,6]
plt.pie(arr,labels=['a','b','c'],labeldistance=0.5,autopct='%.2f%%',pctdistance=0.8)

数据分析之matplotlib.pyplot模块

  3.4 设置每块顶点离中心的距离

arr=[2,4,6]
plt.pie(arr,labels=['a','b','c'],labeldistance=0.5,autopct='%.2f%%',pctdistance=0.8,explode=[0.2,0.4,0.3])

数据分析之matplotlib.pyplot模块

 

  八、散点图

散点图需要两个参数x,y,但此时x不是表示x轴的刻度,而是每个点的横坐标!
scatter()
x = np.random.random(size=(100))
y = np.random.random(size=(100))
plt.scatter(x,y)

数据分析之matplotlib.pyplot模块

  1,meshgrid()和散点图结合扩展

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

x1=np.arange(1,5,0.01)
y1=np.arange(1,5,0.01)

arr1=np.meshgrid(x1,y1)[0]
arr2=np.meshgrid(x1,y1)[1]

plt.scatter(arr1,arr2)

数据分析之matplotlib.pyplot模块

上一篇: 常用命令

下一篇: MapReduce基础