欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

初学数据挖掘——数据探索(六):数据特征分析之相关性分析

程序员文章站 2024-03-07 16:50:39
...

相关性分析即分析连续变量之间线性相关程度的强弱,并用合适的统计量或统计图表示出来的过程。

如现在想要分析得到不同菜品之间的相关关系,则可以通过分析这些菜品日销售量之间的相关性来得到。

代码如下:

#导入相关包
from __future__ import print_function
import pandas as pd

catering_sale = './data/catering_sale_all.xls'  # 餐饮数据,含有其他属性
data = pd.read_excel(catering_sale, index_col = u'日期')  # 读取数据,指定“日期”列为索引列

print(data.corr())  # 相关系数矩阵,即显示出任意两款菜式之间的相关系数

初学数据挖掘——数据探索(六):数据特征分析之相关性分析

print(data.corr()[u'百合酱蒸凤爪'])  # 只显示“百合酱蒸凤爪”与其他菜式的相关系数

初学数据挖掘——数据探索(六):数据特征分析之相关性分析

# 计算“百合酱蒸凤爪”与“翡翠蒸香茜饺”的相关系数
print(data[u'百合酱蒸凤爪'].corr(data[u'翡翠蒸香茜饺']))

初学数据挖掘——数据探索(六):数据特征分析之相关性分析
上述例子通过各个菜品之间的相关系数,可以确定各个菜品之间的联系,就可以根据各个菜品之间的相关系数给顾客推荐菜品。

上一篇: C语言实例

下一篇: Dagger2 小记