欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

【pandas】常用统计指标

程序员文章站 2022-04-13 15:42:47
...

1. 分位数

pandas 和 numpy中都有计算分位数的方法,pandas中是quantile,numpy中是percentile

两个方法其实没什么区别,用法上稍微不同,quantile的优点是与pandas中的groupby结合使用,可以分组之后取每个组的某分位数

  • quantile
import numpy as np
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
import os,sys

os.chdir('/Users/cc/Documents/cc工作生意金/标准化平台/储蓄卡相关/储蓄卡变量分析/数据') 
data1=pd.read_csv('chuxuka_data.csv')

#将data按LOAN_MONTH分组
grouped=data1.groupby(['loan_month'])
#用quantile计算每个月份的第40%的分位数
grouped['trans_num_new'].quantile(0.4) 

【pandas】常用统计指标

  • PERCENTILE
    a=np.array(data1['trans_num_new']) np.percentile(a,0.4)
    【pandas】常用统计指标

2. 取整

向上取整ceil 向下取整FLOOR 四舍五入 round