数据可视化--pivot_table和crosstab
程序员文章站
2022-03-10 16:21:01
...
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
df = DataFrame({'类别':['水果','水果','水果','蔬菜','蔬菜','肉类','肉类'],
'产地':['美国','中国','中国','中国','新西兰','新西兰','美国'],
'水果':['苹果','梨','草莓','番茄','黄瓜','羊肉','牛肉'],
'数量':[5,5,9,3,2,10,8],
'价格':[5,5,10,3,3,13,20]})
print(df)
1. pivot_table
pivot_table(指定行列对表内数值进行操作)
print(df.pivot_table(index=['产地','类别']))
print(df.pivot_table(index=['产地']))
行索引为产地和类别,默认列索引为价格和数量,值为价格和数量的平均值
行索引为产地,默认列索引为价格和数量,值为价格和数量的平均值
类似于以“产地和类别”或者“产地”分组,求取均值默认为数值类型的均值
列为产地、类别,行则为数量、价格的均值
print(df.pivot_table(columns=['产地','类别']))
不同产地不同类别下的价格值
按照产地、类别进行分类,统计价格最大值,aggfunc为聚合函数,可求平均值、加和值、最大最小值等,margins分类后的值进行加和,缺失值填充为0
df.pivot_table(values="价格",index="产地",columns="类别",aggfunc="sum",fill_value=0,margins=True)
print(df.pivot_table('价格',index='产地',columns='类别',aggfunc='max',margins=True,fill_value=0))
print(df.pivot_table('价格',index='产地',columns='类别'))
2. crosstab
crosstab( 按类别分组,统计各个分组中产地的频数)
print(pd.crosstab(df['类别'],df['产地'],margins=True))
上一篇: DataGear 制作省/市二级联动下拉框看板表单
下一篇: Superset查询用户报表看板权限
推荐阅读
-
美国军方寻求大数据处理软件和动态可视化系统
-
python数据可视化 – 利用Bokeh和Bottle.py在网页上展示你的数据
-
分别采用线性LDA、k-means和SVM算法对鸢尾花数据集和月亮数据集进行二分类可视化分析
-
Python数据可视化之绘制柱状图和条形图
-
Python数据分析之绘图和可视化详解
-
熬夜整理的资料:分享Python数据可视化图表代码和案例给大家
-
离散数据和离散函数可视化——简单的绝对值函数例子
-
数据分析和科学计算可视化
-
FusionCharts中文教程:自定义图表的X轴和Y轴 fusioncharts教程图表工具数据可视化工具
-
PyTorch + visdom + netron 实现网络数据和模型结构的可视化