【pandas】常用统计指标
程序员文章站
2022-04-13 15:42:47
...
1. 分位数
pandas 和 numpy中都有计算分位数的方法,pandas中是quantile,numpy中是percentile
两个方法其实没什么区别,用法上稍微不同,quantile的优点是与pandas中的groupby结合使用,可以分组之后取每个组的某分位数
- quantile
import numpy as np
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
import os,sys
os.chdir('/Users/cc/Documents/cc工作生意金/标准化平台/储蓄卡相关/储蓄卡变量分析/数据')
data1=pd.read_csv('chuxuka_data.csv')
#将data按LOAN_MONTH分组
grouped=data1.groupby(['loan_month'])
#用quantile计算每个月份的第40%的分位数
grouped['trans_num_new'].quantile(0.4)
- PERCENTILE
a=np.array(data1['trans_num_new']) np.percentile(a,0.4)
2. 取整
向上取整ceil 向下取整FLOOR 四舍五入 round
上一篇: Easyui自带图标统计
下一篇: 折线分割平面