概率论与数理统计(学习笔记)——平平无奇的知识点
概率论与数理统计
第一章:随机事件及其计算
自然现象:确定性现象
随机现象:事先不能准确预知其结果的现象。
1.1、单位名称
样本点(ω):实验中可能出现的基本结果
样本空间(Ω): 全部样本点构成的集合
随机时间(A):由一个或多个样本点构成的集合
必然事件(Ω):必然发生的事件
不可能事件(∅):不可能发生的事件
事件发生是指在事件当中某一个样本点发生了,通常指事情出现了
注:
样本空间和必然事件都用一样的符号表示,是因为样本空间的符号是Ω,在样本空间里面讨论一个个事情,它们是必然会发生的,那么这个必然发生的事情就是一个样本点,而样本点就是构成样本空间的基本元素。
1.1.1、数字符号对比:
数学符号 | 概率论 | 集合论 |
---|---|---|
Ω | 样本空间、必然事件 | 全集 |
ω | 样本点 | 元集 |
A,B,C…… | 随机事件 | 子集 |
∅ | 不可能事件 | 空集 |
1.1.2、习题
1、抛掷一枚均匀的筛子,观察出现的点数
Ω1={1,2,3,4,5,6} #列举法
2、某超市一天内来到的顾客数:
Ω2={0,1,2,3,4……} #按自然数排列,整数
3、在一批灯泡中任取一只,测试他的寿命
Ω3={t:t>=0} #描述法,整体的区间
集合的表示方法:
- 描述法
- 列举法
- 列表
1.1.3、符号的读法
符号 | 读法 |
---|---|
Ω | o_mi_ga |
ω | o_mi_ga |
1.2、事件的关系和运算
1.2.1、事件的包含与相等
概念: 若事件A发生必然导致事件B发生,则称事件B包含事件A ,记作,B⊃A 或 A⊂B .
A小B大。
解释: 事件A发生,那么事件B一定发生,可以理解为:只要A发生,B也会发生 。那么,A就是B的一部分,B包含着A。
例如:某KTV招男服务员要求:只要身高符合,样貌合格,就可以招聘。
A:身高符合
B:样貌合格
C:可以招聘
在这个例子中我们可以把三个事件命名为:事件A 、事件B、事件C ,当事件C发生时,那么事件A和事件B就一定会发生,所以可以表示: C ⊃ A ,C ⊃ B 。
注: 若事件A包含事件B,事件B也包含事件A ,则称A=B。
1.2.2、事件的和(并)
概念: 事件A和事件B至少发生其一的事件称为事件A与B的和事件(或并事件),记作A∪B或者 B∪A 。
解释: 在某一个样本空间Ω中,有两个事件,这两个事件只要有一个发生了,那么就称事件A并事件B。
也可理解为:一个事件 C 的必然结果是由其他两个事件A和B中任意一个发生后而产生的,就称C=A∪B。
例如:某娱乐场所的游玩标准是:体重合格、身高合格
A:体重不合格
B:身高不合格
C:谢绝游玩
上例中,事件A或者事件B任意一个发生,那么事件C就不会发生了,所以记作:C=A∪B 。
1.2.3、事件的积
概念: 事件A和事件B同时发生的事件称为事件A与B的积事件,记作 AB 或A∩B
解释: 一个事件C的必然结果是由其他两个事件A和B共同发生后而产生的,就称 C=A∩B
例如:小美要男朋友,还要又帅有有钱的。
A:长得帅气
B:非常有钱
C:成为小美的男朋友
上例中,事件C如果想要发生,那么事件A与事件B必须同时发生,所以记作:C=A∩B 。
1.2.4、事件的互斥
概念: 若事件A和事件B不可能同时发生,即AB=∅,则称事件A与B互为互斥事件,或互不相容事件。
理解: 事件A与事件B不能同时发生。
那么在样本空间Ω中,事件A与事件B不能同时存在。
例如:小明掉了一头羊在河里,这时有位老神仙飘了出来问他:“年轻的小伙子呀,你说你是要这头金色的羊还是要这头银色的羊,还是要这头普通的羊呢?”
A:选择金色的羊
B:选择银色的羊
C:选择普通的羊
D:扶我上岸
上例中,事件A 与事件B不能同时发生,只能选择其一,所以记作:A∩B= ∅ 或 AB= ∅。
1.2.5、事件的互逆(对立)
概念 : 若A∪B=Ω, 则称事件A与B为互逆事件,或对立事件,把A的对立事件记作 “A拔” .
理解:是指一个样本空间里,只有唯一的一个事件在样本空间Ω里发生,并且这些唯一能发生的事件共同组成了样本空间Ω,每次考虑样本点都应把所有的事件都考虑到里面。
例如:小白的老婆和老妈同时掉河里了,小白必须救一个。
A:救老婆
B:救老妈
上例中,事件A与事件B共同组成了一个样本空间,并且这个空间只能从其中选取一件事来做,所以记作:A∪B= Ω 。
注:对立一定互斥,互斥不一定对立。
- 解释:对立的事件共同组成了一个样本空间,里面的事件只能发生一个;而互斥的事件可以有其他的与研究的样本点无关的事件,所以 互斥的事件不一定是对立的。
1.2.6、事件的差
概念:事件A发生而事件B不发生的事件称为A与B的差事件,记作A-B。
理解 :A与B相交,A除去相交的部分,就是A-B,也可以写成A-AB,同时也可以写成 A − A B ‾ A-A\overline{B} A−AB,再者还可以看做;再如,A中包含B,那么A-B就是A与B的差。
推广: A ‾ = Ω − A \overline{A}=Ω-A A=Ω−A , 假设在样本空间Ω里有事件A, A ‾ \overline{A} A就是整个样本空间减去事件A。
1.2.7、事件的运算律
-
交换律
A ⋃ B = B ⋃ A A ⋂ B = B ⋂ A A\bigcup{B}=B\bigcup{A}\\A\bigcap{B=B\bigcap{A}} A⋃B=B⋃AA⋂B=B⋂A
-
结合律
A ⋃ ( B ⋃ C ) = ( A ⋃ B ) ⋃ C A ⋂ ( B ⋂ C ) = ( A ⋂ B ) ⋂ C A\bigcup(B\bigcup{C})=(A\bigcup{B})\bigcup{C}\\A\bigcap{(B\bigcap{C})}=(A\bigcap{B})\bigcap{C} A⋃(B⋃C)=(A⋃B)⋃CA⋂(B⋂C)=(A⋂B)⋂C
-
分配率
A ⋂ ( B ⋃ C ) = ( A ⋂ B ) ⋃ ( A ⋂ C ) A ⋃ ( B ⋂ C ) = ( A ⋃ B ) ⋂ ( A ⋃ C ) A\bigcap(B\bigcup{C})=(A\bigcap{B})\bigcup(A\bigcap{C})\\A\bigcup(B\bigcap{C})=(A\bigcup{B})\bigcap{(A\bigcup{C})} A⋂(B⋃C)=(A⋂B)⋃(A⋂C)A⋃(B⋂C)=(A⋃B)⋂(A⋃C)
-
对偶率
A ⋂ B ‾ = A ‾ ⋃ B ‾ \overline{A\bigcap{B}}=\overline{A}\bigcup{\overline{B}} A⋂B=A⋃B
⋃ i = 1 n A i ‾ = ⋂ i − 1 n A i ‾ \overline{\bigcup\limits_{i=1}^n A_i}=\bigcap\limits_{i-1}^n\overline{A_i} i=1⋃nAi=i−1⋂nAi
⋂ i = 1 n ‾ A i = ⋃ i = 1 n A i ‾ \overline{\bigcap\limits_{i=1}^n}A_i=\bigcup\limits_{i=1}^n\overline{A_i} i=1⋂nAi=i=1⋃nAi
1.3、随机事件的概率及性质
1.3.1、统计定义
频率公式: ω ( Ω ) = m n \omega(\Omega)=\frac{m}{n} ω(Ω)=nm ,m为随机事件 ,n为实验次数。
概率的定义:概率是描述事件发生的可能性大小的数值,是客观存在的值
概率的统计定义:当实验次数n增大时, ω ( A ) \omega(A) ω(A)稳定与p , P(A)=p,当n很大是用时频率值表示概率值。 P ( A ) ≈ ω ( A ) P(A)\approx\omega(A) P(A)≈ω(A)
频率的性质:
- 对于任意事件A, 0 ≤ ω ( A ) ≤ 1 0\leq\omega(A)\leq 1 0≤ω(A)≤1
- 必然发生事件 : ω ( Ω ) = 1 \omega(\Omega)=1 ω(Ω)=1 偶然凡是的事件: ω ( ∅ ) = 0 \omega(\varnothing)=0 ω(∅)=0
- 设 A 1 , A 2 , ⋯ , A k A_1,A_2,\cdots,A_k A1,A2,⋯,Ak是两两互斥的事件,则 ω ( A 1 + A 2 + ⋯ + A k ) = ω ( A 1 ) + ω ( A 2 ) + ⋯ + ω ( A k ) \omega(A_1+A_2+\cdots+A_k)=\omega(A_1)+\omega(A_2)+\cdots+\omega(A_k) ω(A1+A2+⋯+Ak)=ω(A1)+ω(A2)+⋯+ω(Ak)
概率的性质:
当实验次数n很大时频率就趋近于概率
- 对于任意事件A, 0 ≤ P ( A ) ≤ 1 0\leq P(A)\leq 1 0≤P(A)≤1
- 必然发生事件 : P ( Ω ) = 1 P(\Omega)=1 P(Ω)=1 偶然凡是的事件: P ( ∅ ) = 0 P(\varnothing)=0 P(∅)=0
- 设 A 1 , A 2 , ⋯ , A k A_1,A_2,\cdots,A_k A1,A2,⋯,Ak是两两互斥的事件,则 P ( A 1 + A 2 + ⋯ + A k ) = P ( A 1 ) + P ( A 2 ) + ⋯ + P ( A k ) P(A_1+A_2+\cdots+A_k)=P(A_1)+P(A_2)+\cdots+P(A_k) P(A1+A2+⋯+Ak)=P(A1)+P(A2)+⋯+P(Ak)
统计定义的缺点 :需要做大量重复的实验,不便于实际应用。不够严密精确,不便理论应用。
统计定义的优点 :直观易懂,适用于未知的情况。
1.3.2、古典定义
古典概型
概率论研究史:
最先研究:
-
有限性:样本空间所含基本事件数目有限
-
等可能性:每个基本事件发生的可能性相同
例如:抛硬币、掷骰子
因最先研究的是这类的概率问题,所以称为 “古典概型”。
古典定义:
定义:设随机实验E是含有n个基本事件的古典概型,事件A包含m个基本事件,那么:
P
(
A
)
=
m
n
=
A
中
所
包
含
的
事
件
的
个
数
Ω
中
所
包
含
的
事
件
的
个
数
P(A)=\frac{m}{n}=\frac{A中所包含的事件的个数}{\Omega中所包含的事件的个数}
P(A)=nm=Ω中所包含的事件的个数A中所包含的事件的个数
是事件A发生的概率。
使用方法:
-
判断事件是否是古典定义事件
-
有限性
-
等可能性
判断它的选择均衡性、几何对称性
-
-
判断出来属于古典概型后,求出m,n即可。
样本点小的话,直接列举出来,样本点大的话运用排列组合的方法。
例题分析:
例一把一枚均匀的硬币连续抛掷两次,事件A表示出现两个正面,事件B表示出现两个相同的面,求P(A)和P(B)。
解: Ω = { ( 正 、 正 ) ( 正 、 反 ) ( 反 、 反 ) ( 反 、 正 ) } \Omega =\lbrace(正、正)(正、反)(反、反)(反、正)\rbrace Ω={(正、正)(正、反)(反、反)(反、正)}
A = { ( 正 、 正 ) } A=\lbrace (正、正)\rbrace A={(正、正)}
B = { ( 正 、 正 ) ( 反 、 反 ) } B=\lbrace(正、正)(反、反)\rbrace B={(正、正)(反、反)}
n = 4 , m a = 1 , m 2 = 2 n=4,m_a=1,m_2=2 n=4,ma=1,m2=2
P ( A ) = m a n = 1 4 P(A)=\frac{m_a}{n}=\frac{1}{4} P(A)=nma=41
P ( B ) = m b n = 2 4 P(B)=\frac{m_b}{n}=\frac{2}{4} P(B)=nmb=42
例二: 一批产品共10件,其中6件正品,4件次品,求下列事件的概率。
- A 1 A_1 A1={从中任取5件,恰有2件次品}
- A 2 A_2 A2={从中依次取5件,恰有2件次品}
- A 3 A_3 A3={从中有放回地取5件,恰有2件次品}
解:
-
满足有限性和等可能性,所以是古典概型,因为是从10件产品中任取5件,所以它的全部组合为 C 10 5 C^5_{10} C105 ,而“从中任取5件,恰有2件次品”的言外之意是“取了2件次品和3件正品”,它们的全部排列组合是 C 4 2 C 6 3 C^2_4 C^3_6 C42C63 。
所以我们得到 : P ( A 1 ) = C 4 2 C 6 3 C 10 5 = 10 21 = 0.4762 P(A_1)=\frac{C^2_4 C^3_6}{C^5_{10}}=\frac{10}{21}=0.4762 P(A1)=C105C42C63=2110=0.4762
注: A m n = m ! ( m − n ) ! A^n_m=\frac{m!}{(m-n)!} Amn=(m−n)!m! , C n m = A n m m ! C^m_n=\frac{A^m_n}{m!} Cnm=m!Anm
-
分析:
- 从10件产品中依次取出5件,是有顺序的取出,所以用到了排列 A ,有 A 6 5 A^5_6 A65种取出方法。
- ,4件次品中有顺序的取2件所以是 A 4 2 A^2_4 A42 ,6件正品中有顺序的取3件是 A 6 3 A^3_6 A63 ,次品和正品的内部做了排列,它们之间还要组合一下,乘以 C 5 2 C^2_5 C52或者 C 5 3 C^3_5 C53 .
所以: P ( A 2 ) = A 4 2 A 6 3 C 5 2 A 10 5 = 12 × 120 × 10 10 × 9 × 8 × ⋯ × 1 = 10 21 P(A_2)=\frac{A^2_4A^3_6C^2_5}{A^5_{10}}=\frac{12\times120\times10}{10\times 9\times 8\times\cdots\times1}=\frac{10}{21} P(A2)=A105A42A63C52=10×9×8×⋯×112×120×10=2110
-
分析:
- 10件产品有放回的取5件,5次抽取每次都面临10种选择,所以是 1 0 5 10^5 105 .
- 4件次品又放回的取2件,是 4 2 4^2 42 ;6件正品有放回的取3件是 6 3 6^3 63
- 有放回的排列,也要考虑组合,所以它们还有乘以 C 5 3 C^3_5 C53或$$C^2_5
所以: P ( A 3 ) = 4 2 6 3 1 0 5 = 16 × 216 100000 = 0.3456 P(A_3)=\frac{4^26^3}{10^5}=\frac{16\times216}{100000}=0.3456 P(A3)=1054263=10000016×216=0.3456
1.3.3、几何定义
问题引入
李大爷和李大妈夫妻一直喜欢在上午9点到10点去上街,公交车1路和2路到达他家的门口时间分别是9:00和9:03,公交车没10分钟发车一次。
问:
- 乘坐1路车的概率是?
- 乘坐2路车的概率是?
分析:
9点到10点共60分钟,1路到的次数是7次,2路到的次数是6次,它们每次相差3分钟,在60分钟这条时间段上,3分钟时间是乘坐2路车的概率,10-3=7分钟时间是乘坐1路车的概率
所以,乘坐1路程概率为70% ,2路车的概率是30%
推广:
- 当样本空间为区间线段的时候,概率值是区间长度之比
- 当样本空间为平面区域时,概率值是区域面积之比
- 当样本空间为空间区域时,概率值是区域体积之比
几何定义
几何概型定义:
- 可度量性:样本空间是几何空间的一个可度量区域
- 等可能性:任意一点罗子昂度量相同的子区域内时等可能的。
定义:设随机实验E是几何概型,
Ω
\Omega
Ω为样本空间,事件A是可度量的,并且
A
⊂
Ω
A\subset\Omega
A⊂Ω ,则定义:
P
(
A
)
=
A
的
度
量
(
长
度
、
面
积
、
体
积
)
Ω
的
度
量
(
长
度
、
面
积
、
体
积
)
P(A)=\frac{A的度量(长度、面积、体积)}{\Omega的度量(长度、面积、体积)}
P(A)=Ω的度量(长度、面积、体积)A的度量(长度、面积、体积)
为事件A发生的概率。
例题分析
例题:
小王和小李一个在基地正北边10公里的地方,一个在基地正东边8公里的地方,它们都向基地行驶,对讲机的通话范围是7公里,求他们能用对讲机交流的概率。
分析:
- 可以看做正东为8 ,正北为10 ,当不设范围圆的时候他们相交的概率不好算。
- 设基地为圆心,通讯距离7为半径,10和8位矩形范围,那么他们的通讯概率就是四分之一的圆除以矩形面积
所以:
设小王距离基地为x公里,小李距离基地为y公里,那么:
Ω = { ( x , y ) ∣ 0 ≤ x ≤ 10 , 0 ≤ y ≤ 8 } \Omega=\lbrace(x,y)|0\le x \le 10,0\le y \le 8\rbrace Ω={(x,y)∣0≤x≤10,0≤y≤8}
A = { ( x , y ) ∣ x 2 + y 2 ≤ 7 , x ≥ 0 , y ≥ 0 } A=\lbrace(x,y)|\sqrt{x^2+y^2}\le7,x\ge0,y\ge0\rbrace A={(x,y)∣x2+y2 ≤7,x≥0,y≥0}
P ( A ) = S A S Ω = 1 4 × π × 7 2 10 × 8 P(A)=\frac{S_A}{S_\Omega}=\frac{\frac{1}{4}\times\pi\times7^2}{10\times8} P(A)=SΩSA=10×841×π×72=48.1%
下一篇: python学习笔记--文本词频统计1