第一章-随机变量与概率估计
程序员文章站
2024-03-25 21:14:22
...
随机变量(random variable)表示随机试验各种结果的实值单值函数。
随机事件不论与数量是否直接有关,都可以数量化,即都能用数量化的方式表达。
随机事件数量化的好处是可以用数学分析的方法来研究随机现象。
例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数,
灯泡的寿命等等,都是随机变量的实例。
在做实验时,常常是相对于试验结果本身而言,我们主要还是对结果的某些函数感兴趣。
例如,在掷骰子时,我们常常关心的是两颗骰子的点和数,而并不真正关心其实际结果,
就是说,我们关心的也许是其点和数为7,而并不关心其实际结果是否是
(1,6)或(2,5)或(3,4)或(4,3)或(5,2)或(6,1)。
我们关注的这些量,或者更形式的说,这些定义在样本空间上的实值函数,称为随机变量。
因为随机变量的值是由试验结果决定的,所以我们可以给随机变量的可能值指定概率。
简单地说,随机变量是指随机事件的数量表现。
例如一批注入某种毒物的动物,在一定时间内死亡的只数;
某地若干名男性健康成人中,每人血红蛋白量的测定值;
等等。另有一些现象并不直接表现为数量,例如人口的男女性别、
试验结果的阳性或阴性等,但我们可以规定男性为1,女性为0,
则非数量标志也可以用数量来表示。这些例子中所提到的量,
尽管它们的具体内容是各式各样的,但从数学观点来看,
它们表现了同一种情况,这就是每个变量都可以随机地取得不同的数值,
而在进行试验或测量之前,我们要预言这个变量将取得某个确定的数值是不可能的。
按照随机变量可能取得的值,可以把它们分为两种基本类型:
离散型
离散型(discrete)随机变量即在一定区间内变量取值为有限个或可数个。
例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。
离散型随机变量通常依据概率质量函数分类,主要分为:伯努利随机变量、
二项随机变量、几何随机变量和泊松随机变量。
连续型
连续型(continuous)随机变量即在一定区间内变量取值有无限个,
或数值无法一一列举出来。例如某地区男性健康成人的身长值、体重值,
一批传染性肝炎患者的血清转氨酶测定值等。
有几个重要的连续随机变量常常出现在概率论中,
如:均匀随机变量、指数随机变量、伽马随机变量和正态随机变量。
下面举一个离散型变量的例子。
我们发现,离散型数据变量,可以给定一个具体的值,就能找到与他对应的有实际意义的值。
而连续性数据变量就不能这样做了。比如说,房产中介今天销售了2套房子/3套房子,都是
可以的,但是说销售了2.5套房子,这个就不可以了,但是连续变量又可以取到2.5.
什么是似然函数?
一句话概括:似然函数是参数的函数。
举个例子:
今天下雨这个结论我们已经知道了,现在在知道这个结论的情况下,
我们去探究一下,到底是A带来的可能性大,还是B带来的可能性大。
概率正好相反,是说,给你A和B,你来探究一下,在A的情况,下雨的可能性有多大,
在B的形况下,下雨的可能性有多大。
下面举个例子讲一下:
极大似然估计
下面就研究一下,极大似然估计到底怎么计算呢!
我们发现,这个计算需要累乘,计算起来就会麻烦。
所以,我们就采用取对数的方法,因为极值点保持不变。
举一个计算的例子。
例子中的具体详情可以暂时不搞清楚,主要先感受一下计算的处理。
按照上面的处理步骤,中间要求对数,再求偏导。