欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

概率统计学习笔记——1.随机事件与随机变量

程序员文章站 2022-04-27 14:57:42
...

概率统计学习笔记——1.随机事件与随机变量

注: 由于这都是《概率论与数理统计》一书中的知识,那么这里就不再过多重复阐述有关的概念定义了,我们整理一下其中重要的知识点。


一、随机事件

1.基本概念:

随机现象样本空间 Ω\Omega样本点 ω\omega随机事件必然事件Ω\Omega就是一个必然事件)、不可能事件


2.概率

主要性质:

  • 对于任一事件AA,均有P(A)=1P(A)P(\overline{A})=1-P(A).
  • 对于两个事件AABB,若ABA \subset B,则有
    P(BA)=P(B)P(A),P(B)>P(A)P(B-A)=P(B)-P(A),P(B) >P(A).
  • 对于任意两个事件AABB,有
    P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A\cap B).

3.等可能概型(古典概型)

古典概型概率公式:
若事件 AA 包含个mm 个样本点,则事件 AA 的概率定义为:
P(A)=mn=AP(A) = \frac{m} {n} = \frac{事件A包含的基本事件数} {基本事件总数}

概率论的历史上有一个颇为著名的问题生日问题:求 k 个同班同学没有两人生日相同的概率,就是一个古典概型。视一年365天,那么他们的生日各不同的概率为 365364...(365k+1)365k\frac{365*364*...*(365-k+1)}{365^k},普遍性地写成公式:
P(A)=Clkklk=llklk!P(A) = \frac {C^k_l*k!} {l^k} = \frac {l!} {l^k*(l-k)!}

编写一段简单Python来解决生日问题:

#只要稍加修改或者包装成一个函数就可以实现类似问题的求解
#我们采用函数的递归的方法计算阶乘:
def factorial(n):
    if n == 0:
        return 1;
    else:
        return (n*factorial(n-1))

l_fac = factorial(365);          #l的阶乘
l_k_fac = factorial(365-40)      #l-k的阶乘
l_k_exp = 365**40                #l的k次方


P_B =  l_fac /(l_k_fac * l_k_exp)     #P(B)
print("事件B的概率为:",P_B)
print("40个同学中至少两个人同一天过生日的概率是:",1 - P_B)

4.条件概率

条件概率公式:
AABB 是两个事件,且P(B)>0P(B)>0,称
P(AB)=P(AB)P(B) P(A|B) = \frac {P(AB)} {P(B)} 为在事件 BB 发生的条件下,事件 AA 发生的概率。


5.全概率公式和贝叶斯公式

  • 重要的知识认知:

    • 概率乘法公式:
      P(AB)=P(BA)P(A)=P(AB)P(B)P(AB)=P(B|A)P(A) =P(A|B)P(B)
    • 如果事件组,满足
    1. B1,B2,...B_1,B_2,... 两两互斥,即BiBj=ϕij,i,j=1,2,...B_i\cap B_j = \phi,i \neq j ,i,j = 1,2,...,且P(Bi)>0,i=1,2,...P(B_i)>0,i=1,2,...
    2. B1B2...=ΩB_1 \cup B_2 \cup ... = \Omega
      则称事件组B1,B2,...B_1,B_2,...是样本空间 Ω\Omega 的一个划分。
  • 全概率公式:
    B1,B2,...B_1,B_2,...是样本空间 Ω\Omega 的一个划分,AA 为任一事件,则
    P(A)=i=1P(Bi)P(ABi)P(A) = \sum_{i=1}^{\infty } {P(B_i)}P(A|B_i) 称为全概率公式。

  • 贝叶斯公式
    B1,B2,...B_1,B_2,...是样本空间 Ω\Omega 的一个划分,则对任一事件 A(P(A)>0)A(P(A)>0) ,有
    P(BiA)=P(BiA)P(A)=P(ABi)P(Bi)j=1P(Bj)P(ABj),i=1,2,...P(B_i|A) =\frac {P(B_i A)} {P(A)} = \frac {P(A|B_i )P(B_i)} {\sum_{j=1}^{\infty }P( B_j)P(A|B_j)} ,i=1,2,...
    称上式为贝叶斯公式,称P(Bi)(i=1,2,...)P(B_i)(i=1,2,...) 为先验概率,P(BiA)i=1,2,...P(B_i|A)(i=1,2,...)为后验概率。
    下面的图能很好的帮助理解贝叶斯公式含义~

概率统计学习笔记——1.随机事件与随机变量


二、随机变量

1.随机变量及其分布

  • 随机变量的分布函数定义:
    XX 是一个随机变量,对任意的实数 xx ,令
    F(x)=P{X<=x},x(,+) F(x) = P \{ X<=x\} ,x \in (- \infty ,+ \infty)
    则称 F(x)F(x) 为随机变量 xx 的分布函数,也称为概率累积函数。

2. 离散型随机变量

如果随机变量 XX 的全部可能取值只有有限多个或可列无穷多个,则称 XX 为离散型随机变量。对于离散型随机变量 XX 可能取值为 xkx_k的概率为:
P{X=xk}=pk,k=1,2,... P \{ X =x_k \} =p_k,k=1,2,...
则称上式为离散型随机变量 XX 的分布律。当然分布律还可以用表格的方式表示。
离散型随机变量的分布函数为:
F(x)=P{X<=x}=xk<=xP{X=xk}=xk<=xPk F (x) = P \{ X<=x \} =\sum_{x_k <=x}{ P \{ X=x_k \} } = \sum_{x_k <=x}{ P_k}


3.常见的离散型分布

一.(0 - 1)分布
二.伯努利实验,二项分布:记作B(nkB(n,k)
分布律为:
P{X=k}=Cnkpk(1p)nk,k=0,1,2,...n. P \{ X =k \} =C^k_np^k(1-p)^{n-k},k=0,1,2,...n.
分布函数为:
Fx=k=[x]Cnkpk(1p)nk,k=0,1,2,...n. F(x) = \sum_{k=}^{[x]} {C^k_np^k(1-p)^{n-k}},k=0,1,2,...n.
其中, [x][x] 表示下取整,即不超过 xx 的最大整数。


4.随机变量的数字特征:

1.数学期望
  • 离散型:设离散型随机变量 XX 的分布律为 P{X=xi}=pi,i=12...P \{ X=x_i\} = p_i ,i =1,2,..., 若级数 ixipi\sum_{i} {|x_i|p_i} 收敛,(收敛指会聚于一点,向某一值靠近,相对于发散)。则称级数 ixipi\sum_{i} {x_ip_i} 的和为随机变量 XX 的数学期望。记为 E(X)E(X) ,即:
    E(X)=ixipi E(X) = \sum_{i} {x_ip_i}

  • 设连续型随机变量 XX 的概率密度函数为 f(x)f(x) ,若积分 +xfxdx\int_{- \infty}^{+ \infty}{|x|f(x)}dx 收敛, 称积分 +xfxdx\int_{- \infty}^{+ \infty}{xf(x)}dx 的值为随机变量 XX 的数学期望,记为 E(X)E(X) ,即:
    E(X)=+xfxdx E(X)= \int_{- \infty}^{+ \infty}{xf(x)}dx
    E(X)E(X) 又称为均值

  • 数学期望代表了随机变量取值的平均值,是一个重要的数字特征。数学期望具有如下性质:

    1. cc 是常数,则 E(c)=cE(c) =c ;
    2. E(aX+bY)=aE(X)+bE(Y)E(aX+bY) = aE(X) +bE(Y) , 其中a, b为任意常数;
    3. X,YX, Y 相互独立,则E(XY)=E(X)E(Y)E(XY) = E(X)E(Y) ; (相互独立就是没有关系,不相互影响)。
2.方差
  • XX 为随机变量,如果 E{[XE(X)]2}E\{ [X-E(X)]^2\} 存在,则称 E{[XE(X)]2}E\{ [X-E(X)]^2\}XX 的方差。记为 Var(X)Var(X) , 即:
    VarX=E{[XE(X)]2} Var (X) =E\{ [X-E(X)]^2\}
    并且称 Var(X)\sqrt{Var(X)}XX 的标准差或均方差。

  • 方差是用来描述随机变量取值相对于均值的离散程度的一个量,也是非常重要的数字特征。方差有如下性质:

    1. cc 是常数,则 Var(c)=0Var(c) =0 ;
    2. Var(aX+b)=a2E(X)Var(aX+b) = a^2E(X) , 其中a, b为任意常数;
    3. X,YX, Y 相互独立,则Var(X+Y)=Var(X)+Var(Y)Var(X+Y) = Var(X) +Var(Y)
3.协方差和相关系数
  • 协方差和相关系数都是描述随机变量 XX 与随机变量 YY 之间的线性联系程度的数字量。

  • X,YX, Y 为两个随机变量,称 E{[XE(X)][YE(Y)]}E\{ [X-E(X)] [Y-E(Y)]\}XXYY 的协方差,记为 Cov(X,Y)Cov(X, Y),即:
    Cov(X,Y)=E{[XE(X)][YE(Y)]} Cov(X, Y) = E\{ [X-E(X)] [Y-E(Y)]\}

  • 协方差有如下性质:

    1. Cov(X,Y)=Cov(Y,X)Cov(X, Y) = Cov(Y, X)

    2. Cov(aX+bcY+d)=acCov(XY)Cov(aX+b,cY+d) =ac Cov( X,Y) ,其中, a,b,c,da,b,c,d 为任意常数

    3. Cov(X1+X2Y)=Cov(X1Y)+Cov(X2Y)Cov(X_1+X_2,Y) =Cov( X_1,Y) +Cov( X_2,Y)

    4. Cov(XY)=E(XY)E(X)E(Y)Cov(X,Y) =E( X,Y) -E( X)E(Y) ; 当 X,YX,Y 相互独立时,有 Cov(XY)=0Cov(X,Y) = 0

    5. Cov(XY)=Var(X)Var(Y)|Cov(X,Y)| = \sqrt {Var(X)} \sqrt {Var(Y)} ;

    6. Cov(XX)=Var(X)Cov(X,X) =Var( X)

  • Var(X)>0Var(Y)>0\sqrt {Var(X)} >0 ,\sqrt {Var(Y)} >0 时,称
    ρX,Y=Cov(XY)Var(X)Var(Y) \rho(X,Y) = \frac{Cov(X,Y)}{\sqrt {Var(X)} \sqrt {Var(Y)}}
    X,YX,Y 的相关系数,它是无纲量的量(也就是说没有单位,只是个代数值)。

  • 基本上我们都会用相关系数来衡量两个变量之间的相关程度。相关系数在-1到1之间,小于零表示负相关,大于零表示正相关。绝对值 ρX,Y|\rho(X,Y)| 表示相关度的大小。越接近1,相关度越大。

概率统计学习笔记——1.随机事件与随机变量