现在简单写写最大似然估计。
最大似然估计是一个概率估计问题,譬如已知一个数据空间X,数据X中的每一个样本都有n为特征。有样本整体x=[x1,x2,x3,x4,.....,xn]。同时了有这样的先验知识,知道数据空间X里面所有的样本,都符合一个的概率密度函数(prob density function),譬如均匀分布,或者高斯分布等。
现在假设样本都符合均匀分布,那么概率密度函数是
f(x)={b−a10x⊂[a,b]x⊂(−∞,a)∪(b,∞)}
那么现在就需要求取概率密度函数中的a,b的值。
现在已知有n个样本,全部带入概率密度函数。并将所有的概率相乘。
就得到y=f(x1)∗f(x2)∗...∗f(xn)
我们在计算上面的公式时,一般都会取一个log值,也就是log−likelyhood最大。
很显然,log(y)这个值最大,那么就让所有的样本的概率值都不为0,这样就很容易得到
a=ximin(x1,x2,x3,x4,.....,xn)
b=ximax(x1,x2,x3,x4,.....,xn)
假如概率密度函数为高斯分布,
f(x)=2πσ1exp(−2σ2(x−μ)2)
其中均值为μ,方差为σ2。
现在有样本x=[x1,x2,x3,x4,.....,xn],需要使所有样本的log−likelyhood最大。
这样令y=log(f(x1)∗f(x2)∗...∗f(xn)),这样就是所有的概率值的加和了。
y=log2πσ1exp(−2σ2(x1−μ)2)+...+log2πσ1exp(−2σ2(xn−μ)2)
其中x=[x1,x2,x3,x4,.....,xn]是已知的,让y最大,那就分别代入拉格朗日的算子,分别求导就好了。求出σ,μ。
以上就是极大似然估计。
简单记录一下上面的公式,后面可能会用到。
公式1
f(x)={b−a10x⊂[a,b]x⊂(−∞,a)∪(b,∞)}
$$
f(x)=
\left \{
\begin{matrix}
\frac{1}{b-a}&x\subset[a,b]\\0&x\subset(-\infty,a)\cup(b,\infty)
\end{matrix}
\right \}
$$
公式2:
f(x)=2πσ1exp(−2σ2(x−μ)2)
$$
f(x)=\frac{1}{\sqrt{{2\pi}}\sigma}\exp(-\frac{(x-\mu)^2}{2\sigma^2})
$$