用Python学分析 - t分布
程序员文章站
2022-12-28 08:02:31
1. t分布形状类似于标准正态分布2. t分布是对称分布,较正态分布离散度强,密度曲线较标准正态分布密度曲线更扁平3. 对于大型样本,t-值与z-值之间的差别很小 作用- t分布纠正了未知的真实标准差的不确定性- t分布明确解释了估计总体方差时样本容量的影响,是适合任何样本容量都可以使用的合适分布 ......
1. t分布形状类似于标准正态分布
2. t分布是对称分布,较正态分布离散度强,密度曲线较标准正态分布密度曲线更扁平
3. 对于大型样本,t-值与z-值之间的差别很小
作用
- t分布纠正了未知的真实标准差的不确定性
- t分布明确解释了估计总体方差时样本容量的影响,是适合任何样本容量都可以使用的合适分布
应用
- 根据小样本来估计呈正态分布且方差未知的总体的均值
- 对于任何一种样本容量,真正的平均值抽样分布是t分布,因此,当存在疑问时,应使用t分布
样本容量对分布的影响
- 当样本容量在 30-35之间时,t分布与标准正态分布难以区分
- 当样本容量达到120时,t分布与标准正态分布实际上完全相同了
*度df对分布的影响
- 样本方差使用一个估计的参数(平均值),所以计算置信区间时使用的t分布的*度为 n - 1
- 由于引入额外的参数(*度df),t分布比标准正态分布的方差更大(置信区间更宽)
- 与标准正态分布曲线相比,*度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高
- *度df愈大,t分布曲线愈接近正态分布曲线,当*度df= ∞ 时,t分布曲线为标准正态分布曲线
图表显示t分布
代码:
1 # 不同*度的学生t分布与标准正态分布 2 import numpy as np 3 from scipy.stats import norm 4 from scipy.stats import t 5 import matplotlib.pyplot as plt 6 7 print('比较t-分布与标准正态分布') 8 x = np.linspace( -3, 3, 100) 9 plt.plot(x, t.pdf(x,1), label='df=1') 10 plt.plot(x, t.pdf(x,2), label='df=20') 11 plt.plot(x, t.pdf(x,100), label = 'df=100') 12 plt.plot( x[::5], norm.pdf(x[::5]),'kx', label='normal') 13 plt.legend() 14 plt.show()
运行结果:
推荐阅读
-
用python + hadoop streaming 分布式编程(一) -- 原理介绍,样例程序与本地调试
-
Python用pandas和matplotlib分析1949-2016年中国各省市历年GDP数据
-
用实例分析Python中method的参数传递过程
-
用Python编写分析Python程序性能的工具的教程
-
用python解压分析jar包实例
-
分析用Python脚本关闭文件操作的机制
-
转:用 Python 一键分析你的上网行为, 看是在认真工作还是摸鱼
-
python用BeautifulSoup库简单爬虫实例分析
-
用Python数据分析选购手机,双十一刚过你选对了嘛
-
用Python分析2000款避孕套,得出这些有趣的结论