Pandas DataFrame 的基本操作之重新索引
程序员文章站
2022-06-05 20:16:30
...
1.reindex:可以对行和列索引,默认对行索引,加上关键字columns对列索引。
import pandas as pd
data=[[1,1,1,1],[2,2,2,2],[3,3,3,3],[4,4,4,4]]
df = pd.DataFrame(data,index=['d','b','c','a'])
print(df)
默认对列索引:如果是新的索引名将会用NaN
df=df.reindex(['a','b','c','d','e'])
print(df)
加上关键字columns对列重新索引:
df=df.reindex(columns=[2,1,3,4,0])
print(df)
2.reindex插值处理:对于index为有序的数据,我们有时候可能会进行一些插值处理,只需要在reindex加上method参数即可,参数如下表
(图片来源:截图于 利用python进行数据分析 Wes McKinney 著)
例子:
import pandas as pd
data=[[1,1,1,1],[2,2,2,2],[3,3,3,3]]
df = pd.DataFrame(data,index=range(3))
print(df)
df=df.reindex([0,1,2,3,4,5],method='ffill')
print('--------------')
print(df)
reindex函数的相关参数:
(图片来源:截图于 利用python进行数据分析 Wes McKinney 著)
上一篇: Pandas高级篇——数据处理
下一篇: 完全二叉树(Complete Binary Tree)或者完美二叉树(Perfect Binary Tree)中结点标号(label)与层数(level)的关系
推荐阅读