机器学习的数学基础加强(二)—— 概率论与贝叶斯先验
程序员文章站
2024-03-07 17:59:27
...
目录
一. 统计数字的概率
给定某正整数N,统计从1到N!的所有数中,首位数字出现1的概率。
进而,可以计算首位数字使2的概率,是3的概率,从而得到一条“九点分布”
import matplotlib.pyplot as plt
def first_digital(x):
while x >= 10:
x //= 10
return x
n = 1
frequency = [0] * 9
for i in range(1, 1000):
n *= i
m = first_digital(n) -1
frequency[m] += 1
print(frequency)
plt.plot(frequency, 'r-', linewidth=2)
plt.plot(frequency, 'go', markersize=8)
plt.show()
100!首位数字出现概率
1000!首位数字出现概率
本福特定律
本福特定律又称第一数学定律,是指在实际生活得出一组数据中以1为首位数字出现的概率约为总数的三成;是直观想象1/9的三倍
- 阶乘/素数数列/斐波那契数数列首位
- 住在地址号码
- 经济数据反欺诈
- 选举投票反欺诈
二. 商品推荐
商品推荐场景中过于聚焦商品推荐往往会损害用户的购物体验,在有些场景中,系统会通过一定成都的随机性给用户带来发现的惊喜感。
假设在某拣场景中,经计算A和B俩个商品与当前访问用户的匹配度都分别为0.8和0.2分,系统将随机为A生成一个均匀分布于0到0.8的最终得分,为B生成一个均匀分布于0到0.2的最终得分,试计算最终B的分数大于A的分数的概率。
三. 概率公式
四. 分布
4.1 两点分布
4.2 二项分布
Taylor展开式
4.3 泊松分布
4.4 均匀分布
4.5 指数分布
指数分布的无记忆性
4.6 正态分布
4.7 总结
4.8 Beta分布
Beta分布期望
五. 指数族
二项分布和高斯分布指数族
Bernoulli分布属于指数族
六. 事件的独立性
6.1 期望
期望的性质
6.2 方差
6.3 协方差
协方差和独立、不相关
协方差的意义
协方差的上界
6.4 Pearson相关系数
协方差矩阵
七. 切比雪夫不等式
大数定律
大数定律的意义
重要推论
八. 伯努利定理
九. 中心极限定理
中心极限定理的意义
上一篇: java 创建线程的几种方式
下一篇: 基于R语言构建的电影评分预测模型