欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

数学

程序员文章站 2022-07-10 23:26:50
...

众数、中位数、均值

1.正态分布
均值=中位数=众数
2.正偏(右偏)
一般分布情况:众数【峰值位置】<中位数<均值【数据数值的分布】
3.负偏*(
一般分布:均值<中位数<众数

'''三个函数求列表均值、中位数、众数'''
def grade_mean(list):
    grade_sum=0
    for i in list:
        grade_sum += i
    grade_mean = grade_sum/len(list)
    return grade_mean

def grade_median(list):
    list.sort()
    if len(list)%2 != 0:
        grade_median_value = list[(int(len(list)-1)/2)]
    elif len(list)%2 != 0:
        grade_median_value = (list[(int(len(list)-1)/2-1)]+list[(int(len(list)-1)/2)])/2
    return grade_median_value

def grade_mode(list):
    list_set=set(list)
    freq_dic ={}
    for i in list_set:
        freq_dic[i]=list.count(i)
    grade_mean = []
    for key,value in freq_dic.items():
        if value == max(freq_dic.values()):
            grade_mean.append(key)
    return grade_mean

四分位数和箱型图

将数列等分为4分
Q1:位于25%的位置,计算方法1*(n+1)/4

Q2: 位于50%的位置,计算方法2*(n+1)/4
Q3:位于75%的位置,计算方法3*(n+1)/4

四分位距

Q1到Q3叫四分位距也就是四分位差IQR

IQR=Q3-Q1
某个数<Q1-1.5IQR 或者大于Q3+1.5IQR

箱线图

*缺图 *
识别异常值
描述数据离散分布
数据清洗

相关标签: 统计