欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python seaborn画热力图(heatmap)删除相关性高的的特征

程序员文章站 2024-03-05 18:18:01
...

seaborn.heatmap(data, vmin=None, vmax=None, annot=None,center=None)

重要参数说明:
data: 二维数组,Series,DataFrame(取index和columns)
vmin,vmax:表示热力颜色的最小值和最大值
annot:是否显示具体数值
center:表示热力颜色的中间值,默认会自动调节
更多参数可以在seaborn官网搜索。
https://seaborn.pydata.org/generated/seaborn.heatmap.html?highlight=heatmap#seaborn.heatmap

由于热力图的可视化特性,经常用来研究特征值之间的相关性。
下面是一个房屋特征热力图来研究特征相关性的例子:

correlation=train_data.corr()
plt.subplots(figsize=(12,9))
sns.heatmap(correlation,vmax=0.8)
plt.savefig("../heatmap")

代码中首先对训练集数据取相关系数,用heatmap函数显示热力图。在参数方面选择了vmax来方便找出相关度比较高的特征,由于格子比较密集没有选择用annot显示数值。图中能很方便的看出相关度比较高的特征(白色的)之后地清洗中删去其中之一即可。(有些时候可以使center=0,来找负相关的,本例中没有负相关度高的特征值)

Python seaborn画热力图(heatmap)删除相关性高的的特征

上一篇: mysql查询练习题

下一篇: