关于pandas表格连接问题
程序员文章站
2024-01-19 15:31:52
...
首先构建下列表格
a=['A','B','C','D','A','B','D','C']
b=['a','b','c','d','a','a','d','c']
c=[10,20,30,40,50,60,70,80]
d=pd.DataFrame({
'A':a,
'B':b,
'MM':c
})
a=d.groupby(['A','B']).agg({'MM':['max']})
d
A B MM
0 A a 10
1 B b 20
2 C c 30
3 D d 40
4 A a 50
5 B a 60
6 D d 70
7 C c 80
a
MM
max
A B
A a 50
B a 60
b 20
C c 80
D d 70
合并的时候
左边值只有一个数据 而右边有两个数据 则合并的时候 左边数据会重生成以适配右边数据
合并前:
左表
变量 | 值 |
---|---|
a | 10 |
右表
变量 | 值 |
---|---|
a | 10 |
a | 20 |
合并后
变量 | 值 | 值2 |
---|---|---|
a | 10 | 10 |
a | 10 | 20 |
上一篇: pandas中关于nan的处理
下一篇: scaleType设置缩放类型