Matplotlib配色之Colormap详解
概述
上一篇详细介绍了 matplotlib 直接使用"格式化的颜色定义"给图表元素配色。如,直接指定 axes.plot
绘制的 line2d 的颜色 fmt = 'r'
。
有时我们希望图表元素的颜色与数据集中某个变量的值相关,颜色随着该变量值的变化而变化,以反映数据变化趋势、数据的聚集、分析者对数据的理解等信息,这时,我们就要用到 matplotlib 的颜色映射(colormap)功能,即将数据映射到颜色。
要实现数据到颜色的映射需要做两件事:
- 变量值的变化范围很大,matplotlib用
[0, 1]
区间的浮点数表示颜色rgb值,首先需要将不同的变量值映射到[0, 1]
区间; - 将映射
[0, 1]
区间的变量值映射到颜色。
matplotlib.colors
模块是实现 colormap 配色功能的核心模块。
- 该模块的
normalize()
类及其子类完成第1个任务; - 该模块的
colormap
类及其子类完成第2个任务。
将上述两个类的实例,即:
- 定义变量数据映射到
[0, 1]
区间的规则; - 和
[0, 1]
映射到颜色的规则。
作为参数传递给绘图函数,即可实现颜色反映变量数据属性的目的。参见下面的入门示例。
入门示例
我们先看一个示例,简单、直观地了解 matplotlib.colors
模块的工作原理。
使用有名的 iris data set(鸢尾属植物数据集)中的数据来演示图表的绘制和配置,这样更接近实际的应用。可以到qq群:457079928中下载这个数据集iris.csv。
iris 数据集首次出现在著名的英国统计学家和生物学家ronald fisher 1936年的论文《the use of multiple measurements in taxonomic problems》中,被用来介绍线性判别式分析。
在这个数据集中,包括了三类不同的鸢尾属植物:iris setosa,iris versicolour,iris virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本。
该数据集测量了 150 个样本的 4 个特征,分别是:
- sepal length(花萼长度)
- sepal width(花萼宽度)
- petal length(花瓣长度)
- petal width(花瓣宽度)
以上四个特征的单位都是厘米(cm)。
%matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt iris_df = pd.read_csv('iris.csv',index_col='index_col') #用花萼长度作为 x 值, 花萼宽度作为 y 值绘制散点图 x = iris_df['petallength'].values y = iris_df['sepallength'].values fig = plt.figure() ax= plt.axes() # 直接指定颜色 # 点的颜色都一样,颜色不反映更多的信息 plt.scatter(x, y,c='g') plt.show()
如果我们分析这个数据,图中的点聚集成 3 个组,如下图所示:
我们希望用点的颜色反映这种分组聚集的信息,可以这样做:
- 定义一个三个颜色的列表为 colormap;
- 定义一个数据归一化的实例,将希望关联颜色的数据映射到
[0, 1]
区间; - 使用 cmap, norm 实现图表元素的分组配色。
%matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt iris_df = pd.read_csv('../topics/iris.csv',index_col='index_col') x = iris_df['petallength'].values y = iris_df['sepallength'].values fig = plt.figure() ax= plt.axes() #创建一个listedcolormap实例 #定义了[0, 1]区间的浮点数到颜色的映射规则 cmp = mpl.colors.listedcolormap(['r','g','b']) # 创建一个boundarynorm实例 # boundarynorm是数据分组中数据归一化比较好的方法 # 定义了变量值到 [0, 1]区间的映射规则,即数据归一化 norm = mpl.colors.boundarynorm([0, 2, 6.4, 7], cmp.n) #绘制散点图,用x值着色, #使用norm对变量值进行归一化, #使用自定义的listedcolormap颜色映射实例 #norm将变量x的值归一化 #cmap将归一化的数据映射到颜色 plt.scatter(x,y,c=x, cmap=cmp, norm=norm, alpha=0.7) plt.show()
上图就比较直观地反映了数据的分组信息。
上面的示例使用了 colors 模块中的主要功能,下面就详细讨论该模块的架构。
maplotlib.colors 模块
matplotlib.colors
模块的架构如下图所示:
matplotlib.colors
模块定义了11个类,定义了10个模块命名空间的方法。
matplotlib.colors
模块的主要功能就是将数字或颜色参数转换为rgb或rgba。
rgb和rgba分别是0-1范围内3个或4个浮点数的序列。参见上一篇 matplotlib 颜色定义格式规范中的相关内容。
此模块包括:
用于将数字归一化的类和方法,即将列表中的数据映射到 [0,1]
区间的浮点数;
用于将归范化后的数字映射到一维数组中的颜色,称之为 colormap。
理解 matplotlib.colors 模块的工作
- 构建一个
[0,1]
或[0, 255]
区间,该区间上有256个点;请想像把这256个点从左到右排列成一个长条; - 通过
normalize
类(或者它的子类,映射方法不同)将数据映射到这个区间,比如上例中'petallength'数据区间是[1.0, 6.9]
, 就将区间[1.0, 6.9]
映射到[0, 1]
; 上例中定义了一个boundarynorm
实例; - 构建一个
colormap
(通常是它的子类)实例,该实例是一个颜色名称列表,或者浮点数数组表示的rgb值; - 这个颜色列表依次排列在
[0, 1]
这个区间的256个点上,但每个颜色(colormap中列出的颜色)占用的位置和区间则由normalize
指定;上例中定义一个cmp = mpl.colors.listedcolormap(['r','g','b'])
,列出了3种颜色; - 如果没有定义
colormap
,则默认使用rc image.cmap
中的设置; - 如果不指定
normalize
,则默认使用colors.normalize
。
matplotlib.colormap类及其子类
matplotlib.colors
模块的colormap
类是一个基类,提供了将[0, 1]
的数据映射到颜色的一些属性和方法供其子类使用,很少直接使用该基类,主要使用它的两个子类:
- listedcolrmap()
- linearsegmentedcolormap()
这两个子类就是两种不同的映射方法。
colors.listedcolormap()子类
listedcolormap()
类从颜色列表生成一个colormap
。
class matplotlib.colors.listedcolormap(colors, name='from_list', n=none)
**colors
**参数有两种形式:
-
matplotlib
接受的规范的颜色列表,如['r', 'g', 'b']
, 或['c0', 'c3', 'c7']
,等,详见基础篇; - 用
[0, 1]
区间的浮点数表示的rgb (n3)或 rgba (n4)的数组,如:array((0.9, 0.1, 0.1),(0.1, 0.9, 0.1),(0.1, 0.1, 0.9))
以colors = ['r', 'g', 'b']
为例:
就是将[0, 1]
区间划分为三段,第一段映射为'r'色,第二段映射为'g'色,第三段映射为'b'色。
请看下面的示例:
#本示例演示对散点条分段着不同颜色 %matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import matplotlib.colors x= np.linspace(1, 12, 24, endpoint=true) y=x/x fig = plt.figure() ax= plt.axes() # 将`[0, 1]`区间简单地分成四段,依次映射为列表`['r','g','b','y']`中列出的颜色 cmp = mpl.colors.listedcolormap(['r','g','b','y']) #绘制散点图,用x值着色 #没有指定norm,所以使用默认的`colors.normalize` #将x的值区间为 [1, 24]`映射(归一化)到`[0, 1]`区间 plt.scatter(x, y,s=120, marker='s', c=x, cmap=cmp) plt.show()
参数 name
可选参数。
给自定义的colormap
命名,将这个colormap注册到matplotlib,后面即可以通过名称来反复调用该colormap。
参数 n
可选参数。
从列表中的颜色输入到映射的颜色数量。默认为none,即列表中的每个颜色都作为一项输入到映射中。简单地说,就是选用列表中的颜色数量。如果
-
n < len(colors)
,列表被截断,即选用列表前n个颜色,后面的丢弃。 -
n > len(colors)
,通过重复列表以扩展列表。
#本示例演示了参数 n 的用法 %matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import matplotlib.colors x= np.linspace(1, 12, 24, endpoint=true) y=x/x fig = plt.figure() ax= plt.axes() ax.set_ylim(0.6, 1.5) # 将`[0, 1]`区间简单地分成 n 段 # 由于n>len(colors),所以重复列表以扩展颜色列表 cmp = mpl.colors.listedcolormap(['c2','c5','c0','c8'],n=6) # n<len(colors),所以截断颜色列表 cmp2 = mpl.colors.listedcolormap(['c2','c5','c0','c8'],n=2) #绘制散点图,用x值着色 #没有指定norm,所以使用默认的`colors.normalize` #将x的值区间为 [1, 24]`映射(归一化)到`[0, 1]`区间 plt.scatter(x, x/x*1.1,s=120, marker='s', c=x, cmap=cmp) plt.scatter(x, x/x*0.9,s=120, marker='s', c=x, cmap=cmp2) plt.show()
colors.linearsegmentedcolormap()子类
class matplotlib.colors.linearsegmentedcolormap(name, segmentdata, n=256, gamma=1.0)
基于线性分段的查找表,从线性映射段创建颜色映射 colormap 对象。
线性分段查找表是使用对每个原色进行线性插值生成的。
segmentdata
参数就是这个线性分段查找表。
segmentdata
是一个带'red'、‘green'、'blue'元素项的字典,即这个字典有三个keys:‘red'、‘green'、‘blue'。
每个健的值是一个列表,值列表的元素是形如: (x, y0, y1)
的元组,每个元组是列表的一行。
注意: ‘red'、‘green'、'blue'元素项不能少。
该字典中每个键的值列表的形式如下:
表中给定颜色的每一行都是形如 x, y0, y1 的元组,若干个元组构成列表。
在每个键的值序列中,x 必须从 0 到 1
单调增加。对于介于 x[i] 和 x[i+1] 之间的任何输入值 z, 给定颜色的输出值将在 y1[i] 和 *y0[i+1]*之间线性插值。
理解线性分段查找表segmentdata
colors.linearsegmentedcolormap()
子类在[0,1]
区间上每个点的颜色是由该点的'red'、‘green'、'blue'三原色的值混合确定;
segmentdata 参数以一个字典形式提供每一段三原色值;
每个原色在[0, 1]
区间上可以分段,分几段由键值对中值列表的行数决定,分段的点则由元组(x, y0, y1)
中的x
值决定,如:
'red': [(0.0, 0.0, 0.0), (0.4, 1.0, 1.0), (1.0, 1.0, 1.0)]
表示:
将[0, 1]
区间分成两段,以 0.4 的位置为断点;[0, 0.4]
区间段内,'red'的值从 0.0 线性增加到 1.0;[0.4, 1.0]
区间段内,'red'的值保持 1.0 不变。
- ‘green', 'blue'值依此类推;
- 每个点的颜色则由三原色值混合而成。
#本示例演示 linearsegmentedcolormap 映射用法 #对数据分段,每一段的内部通过线性插值获得颜色值 #请注意比较与listedcolormap的不同 %matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt x= np.linspace(1, 12, 24, endpoint=true) y=x/x fig = plt.figure() ax= plt.axes() ax.set_ylim(0.5,1.1) # 在0.4位置设置断点,分为两段 # 从0.0到0.4之间的 red 值是从 1.0 到 0.0 线性插值生成的(即渐变的),即从红色到黑色 # green, blue的值从开始点到结束点都是零 # 从 0.4 到 1.0,则始终是红色 cdict1 = {'red': [(0.0, 0.0, 1.0), (0.4, 0.0, 1.0), (1.0, 1.0, 1.0)], 'green': [(0.0, 0.0, 0.0), (1.0, 0.0, 0.0)], 'blue': [(0.0, 0.0, 0.0), (1.0, 0.0, 0.0)]} #将断点设置在0.8的位置 cdict2 = {'red': [(0.0, 0.0, 1.0), (0.8, 0.0, 1.0), (1.0, 1.0, 1.0)], 'green': [(0.0, 0.0, 0.0), (1.0, 0.0, 0.0)], 'blue': [(0.0, 0.0, 0.0), (1.0, 0.0, 0.0)]} cmp1 = mpl.colors.linearsegmentedcolormap('name',cdict1) cmp2 = mpl.colors.linearsegmentedcolormap('name',cdict2) #绘制散点图,用x值着色 plt.scatter(x, x/x*0.9,s=120,marker='s',c=x,cmap=cmp1,edgecolor='black') plt.scatter(x, x/x*0.7,s=120,marker='s',c=x,cmap=cmp2,edgecolor='black') plt.show()
# 再看一个示例 %matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt x= np.linspace(1, 12, 24, endpoint=true) y=x/x fig = plt.figure() ax= plt.axes() cdict = {'red': [(0.0, 0.0, 0.2), (0.5, 1.0, 1.0), (1.0, 1.0, 1.0)], 'green': [(0.0, 0.0, 0.5), (0.75, 1.0, 1.0), (1.0, 1.0, 1.0)], 'blue': [(0.0, 0.0, 0.3), (0.25,0.0, 0.0 ), (0.5, 0.0, 0.0), (1.0, 1.0, 1.0)]} cmp = mpl.colors.linearsegmentedcolormap('lsc',segmentdata=cdict) #绘制散点图,用x值着色 plt.scatter(x, y,s=120,marker='s',c=x,cmap=cmp,edgecolor='black') plt.show()
matplotlib.cm 模块
matplotlib.colors
模块:
- 用于构建一个
[0, 1]
的标量数据到颜色的映射,colormap 实例; - 将实际数据归一化到
[0, 1]
区间,normalize
及其子类的实例。
有时我们还需要对上述实例进行一些处理,如将自定义的colormap注册到matplotlib,后面通过其名称调用它;查询colormap在某个数据归一化方法下各点的rgba值。
matplotlib设计了cm
模块,提供了:
- 内置的颜色映射 colormap,将颜色名称映射到标准的颜色定义;
- colormap 处理工具;
- 如注册一个colormap,通过名称获取一个colormap;
-
scalarmappable
混合类,这个混合类用以支持将标量数据映射到rgba颜色。scalarmappable
在从给定的colormap返回rgba颜色之前使用数据归一化化。
cm
模块设计了 1 个混合类,提供了17个函数方法。
其中有3个函数方法属于模块空间:
- matplotlib.cm.get_cmap(name=none, lut=none)
- matplotlib.cm.register_cmap(name=none, cmap=none, data=none, lut=none)
- matplotlib.cm.revcmap(data)
有14个函数方法属于scalarmappable
类空间:
- add_checker(self, checker)
- autoscale(self)
- autoscale_none(self)
- changed(self)
- check_update(self, checker)
- get_alpha(self)
- get_array(self)
- get_clim(self)
- get_cmap(self)
- set_array(self, a)
- set_clim(self, vmin=none, vmax=none)
- set_cmap(self, cmap)
- set_norm(self, norm)
- to_rgba(self, x, alpha=none, bytes=false, norm=true)
class scalarmappable
class matplotlib.cm.scalarmappable(norm=none, cmap=none)
scalarmappable
混合类,用于支持标量数据到rgba的映射。在从给定的colormap中返回rgba颜色之前,scalarmappable利用了数据归一化。
注: 使用了scalarmappable实例的to_rgba()
方法。
matplotlib.cm.scalarmappable
类充分利用data->normalize->map-to-color
处理链,以简化操作的步骤。
scaplarmapable
类以matplotlib.colors
模块的 normalize
实例和colormap
实例为参数。
如果是norm
= none, norm 默认为colors.normalize对象。
colormap 有三个来源:
- 内置的;
- 第三方的colormap库;
- 自定义的。
如果为none,默认为
rcparams.image.cmap
中的设置。
matplotlib.colors
和 matplotlib.cm
模块的关系如下图所示:
%matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt x= np.linspace(1, 12, 24, endpoint=true) y=x/x fig = plt.figure() ax= plt.axes() ax.set_ylim(0.8, 1.2) #传递不同的cmap #绘制散点图,用x值着色 plt.scatter(x, y*1.05,s=120, marker='s',c=x, cmap='viridis') plt.scatter(x, y*0.95,s=120, marker='s',c=x, cmap='magma') plt.show()
#观察相同的cmap,不同的norm,返回的rgba值 norm1 = mpl.colors.lognorm() norm2 = mpl.colors.twoslopenorm(0.4) sm1 = mpl.cm.scalarmappable(norm1, 'viridis') sm2 = mpl.cm.scalarmappable(norm2, 'viridis')
#观察相同的norm, 不同的cmap,返回的rgba值 norm = mpl.colors.lognorm() sm3 = mpl.cm.scalarmappable(norm, 'viridis') sm4 = mpl.cm.scalarmappable(norm, 'magma')
再看一个实例
%matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt iris_df = pd.read_csv('iris.csv',index_col='index_col') iris_df.head() petal_l = iris_df['petallength'].values sepal_l = iris_df['sepallength'].values x = petal_l y = sepal_l fig = plt.figure() ax= plt.axes() #调用cm.get_cmap()方法, #获取内置的名为'ocean'的olormap实例 cmp = plt.get_cmap('ocean') #创建一个normalize实例 norm = plt.normalize(vmin=np.min(x),vmax=np.max(x)) #绘制散点图,用x值着色, #使用norm对进行归一化, #使用内置的'ocean'映射 plt.scatter(x, y,c=x,cmap=cmp,norm=norm) plt.show()
到此这篇关于matplotlib配色之colormap详解的文章就介绍到这了,更多相关matplotlib colormap内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!