欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

统计学常用指标

程序员文章站 2024-03-24 15:44:04
...

标准差(SD)

标准差(StandardDeviation),在概率统计中最常使用作为统计分布程度(statisticaldispersion)上的测量。标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。一个较低的标准差表示这些值趋向于接*均(也称为期望值)的集合,而较高的标准差表示这些值分布在更大的范围内。标准差的平方即方差。
统计学常用指标
自变量,x, 总数,n
因变量,y
预测值,f 下同

f = w*x +b
SD = math.sqrt( sum(np.square(f - np.mean(f))) / n )

均方根误差(RMSE/RMSD)

Root Mean Square Error,即均方根误差或者Root-mean-square deviation (RMSD),均方根偏差。用于衡量模型预测值和真值(y)之间的偏差。
统计学常用指标

RMSE = math.sqrt( sum(np.square(f - y) ) / n )

均方误差(MSE/MSD)

Mean Square Error,均方误差。均方根误差的平方。通过平方的形式便于求导,所以常被用作线性回归的损失函数。

MSE = sum(np.square(f - y) ) / n 

平均绝对误差(MAE)

Mean Absolute Error,即平均绝对误差,可表示模型预测值与真值之间的误差。MAE在概念上比RMSE更简单,更易解释。MAE只是散点图中每个点与Y = X线之间的平均绝对垂直或水平距离。换句话说,MAE是X和Y之间的平均绝对差。
统计学常用指标

MAE = sum(np.abs(f - y) ) / n

决定系数/拟合优度(R^2)

来自*
统计学常用指标

Residual = sum( np.square(y - f) )          # 残差平方和
total = sum( np.square( y - np.mean(y) ) ) #总体平方和
R_square = 1 - Residual / total # 相关性系数R^2

可以看出当模型建立的准确度越高,SSres将越小,即R^2越大。
更多关于R^2的理解可以参考这篇博客r的平方为什么是R方?

相关标签: 统计学/数学