一次算法应用记录
程序员文章站
2022-05-14 17:36:21
...
适配一个测温模块,由于受环境温度影响,测温模块得到的数据不是精确的人体温度,需要做适当的校准。如何获取校准的偏移值呢?
通过大样本统计,通过分析样本数据,在数据中低概率出现坏数据,如果不提出,很大影响正确的数据,那么该如何剔除呢?这是就需要使用统计学中的算法:标准差、正态分布。
剔除坏数据的方法
- 平均值法
比较粗略的方法是:样本数据取平均值,然后把偏差值过大的数据剔除。从理论上可以剔除一些,但是准确性未找到理论支撑。
为了数据更准确,想要获取大数据中比较集中的数据且总数据中占60%或者更高比率的数据时,该如何做?
- 标准差、正态分布方法
标准差、正态分布是统计学中已经被证明的且经常使用的统计筛选算法,正确性可以不做怀疑。简单说明如下:
正态分布
如果需要获取平准值周围的68%的数据,可以使用如下公式:
平均值为:u
标准差为:a
u-a < 取值范围 < u+a
若需要在大样本中获取不同范围的数据,给标准差a乘以不同的系数,然后筛选需要的数据。
也可以对标准差做限定,判断数据的离散度,若离散度不符合需要,可以重新统计和筛选数据。
离散度高,说明数据波动比较大。