初学数据挖掘——数据探索(六):数据特征分析之相关性分析
程序员文章站
2024-03-07 16:50:39
...
相关性分析即分析连续变量之间线性相关程度的强弱,并用合适的统计量或统计图表示出来的过程。
如现在想要分析得到不同菜品之间的相关关系,则可以通过分析这些菜品日销售量之间的相关性来得到。
代码如下:
#导入相关包
from __future__ import print_function
import pandas as pd
catering_sale = './data/catering_sale_all.xls' # 餐饮数据,含有其他属性
data = pd.read_excel(catering_sale, index_col = u'日期') # 读取数据,指定“日期”列为索引列
print(data.corr()) # 相关系数矩阵,即显示出任意两款菜式之间的相关系数
print(data.corr()[u'百合酱蒸凤爪']) # 只显示“百合酱蒸凤爪”与其他菜式的相关系数
# 计算“百合酱蒸凤爪”与“翡翠蒸香茜饺”的相关系数
print(data[u'百合酱蒸凤爪'].corr(data[u'翡翠蒸香茜饺']))
上述例子通过各个菜品之间的相关系数,可以确定各个菜品之间的联系,就可以根据各个菜品之间的相关系数给顾客推荐菜品。
上一篇: C语言实例
下一篇: Dagger2 小记
推荐阅读
-
初学数据挖掘——数据探索(六):数据特征分析之相关性分析
-
制造业SAP&R语言数据挖掘之辅材消耗分析
-
制造业MES&R语言数据挖掘之设备故障分析
-
数据分析------>相关分析之距离分析在道具购买量的应用探索 数据分析游戏道具距离分析
-
数据分析之特征值与奇异值
-
零基础入门数据挖掘-二手车交易价格预测之数据分析
-
pandas数据相关性分析_使用Pandas,SciPy和Seaborn进行探索性数据分析
-
数据分析小白入门篇,MathorCup 无车承运人平台线路定价问题,特征间的相关性分析
-
ML之FE:利用FE特征工程(分析两两数值型特征之间的相关性)对AllstateClaimsSeverity(Kaggle2016竞赛)数据集实现索赔成本值的回归预测
-
数据分析正式篇之第六节