数据分析学习笔记3
程序员文章站
2022-03-20 18:03:17
...
线性回归模型与不服从正太分布时的t检验
1、线性回归模型
# 简单线性回归模型
sns.lmplot(x='Year',y='GDP',data=data,truncate=True)
fit = sm.formula.ols('GDP~Year',data=data).fit() # 模型拟合
fit.params # 查看模型参数
# 多元线性回归模型
fit=sm.formula.ols('Profit~RD_Spend+Administration+Marketing_Spend',data=data).fit() # 初步拟合模型
fit.summary() # 查看模型检验
fit2=sm.formula.ols('Profit~RD_Spend+Marketing_Spend',data=data).fit() # 优化后模型拟合
pred=fit2.predict(data[['RD_Spend','Marketing_Spend']]) # 预测
x=pd.concat([pd.Series(data.Profit,name='real'),pd.Series(pred,name='prediction')],axis=1) # 查看预测值与真实值结果
2、不服从正太分布时的t检验
# 单样本t检验
import numpy as np
stats.wilcoxon(np.array(data,dtype=float)-7725) # 数据不服从正太分布时用wilcoxon检验
# 配对/独立样本t检验
stats.mannwhitneyu(data1,data2) # 当数据不是正态分布时用mannwhitneyu检验