欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

数据分析学习笔记3

程序员文章站 2022-03-20 18:03:17
...

线性回归模型与不服从正太分布时的t检验

1、线性回归模型

# 简单线性回归模型
sns.lmplot(x='Year',y='GDP',data=data,truncate=True)
fit = sm.formula.ols('GDP~Year',data=data).fit()  # 模型拟合
fit.params  # 查看模型参数

# 多元线性回归模型
fit=sm.formula.ols('Profit~RD_Spend+Administration+Marketing_Spend',data=data).fit()  # 初步拟合模型
fit.summary()  # 查看模型检验
fit2=sm.formula.ols('Profit~RD_Spend+Marketing_Spend',data=data).fit()  # 优化后模型拟合
pred=fit2.predict(data[['RD_Spend','Marketing_Spend']])  # 预测
x=pd.concat([pd.Series(data.Profit,name='real'),pd.Series(pred,name='prediction')],axis=1)  # 查看预测值与真实值结果

2、不服从正太分布时的t检验

# 单样本t检验
import numpy as np
stats.wilcoxon(np.array(data,dtype=float)-7725)  # 数据不服从正太分布时用wilcoxon检验

# 配对/独立样本t检验
stats.mannwhitneyu(data1,data2)  # 当数据不是正态分布时用mannwhitneyu检验