欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

pandas(二)

程序员文章站 2022-07-04 23:20:32
层级索引: index=[('a',2010),('b',2011),('c',2010'),('a',2012),('e',2010),('f',2011)] age=[18,17,18,16,18,17] 常规创建 pop =pd.Series(age,index=index) MultiInd ......

层级索引:

  index=[('a',2010),('b',2011),('c',2010'),('a',2012),('e',2010),('f',2011)]

  age=[18,17,18,16,18,17]

常规创建

  pop =pd.series(age,index=index)

multiindex创建

  index= pd.multiindex.from_tuples(index)

  pop = pop.reindex(index)   最原先的索引重置为multiindex

  pop[:,2010]  取出2010的所有数据

  

高维数据的多级索引:

  pop_df = pop.unstack()   

  本质是生成一个a-f为行索引,年份为列索引的矩阵,缺失值用nan

  pop = pop_df.stack()   和unstack相反

 

多级索引创建:

  直接将index参数设为二维

  df = pd.dataframe(np.random.rand(4,2),

              index=[['a','a','c','d'],[1,2,1,1]],

              columns=['data1','data2'])

 

  将元祖作为键的字典传入

  data = {('a',1):18,('a',2):19,('b',1):20}

  pd.series(data)  

  

  显式创建多级索引

  pd.multiindex.from_arrays([['a','a','b','b'],[1,2,1,2]])

  pd.multiindex.from_tuples([('a',1),('a',2),('b',1),('b',2)])  

 

多级索引等级名称

  pop.index.names=['name','year']  以前面例子来说给name是a一列的名称,year是2010一列的形成

 

series多级索引

 获取单个元素:

  pop['a',2010]

  也可以支持局部取值

  pop['a']

  局部切片

  pop['a':'c']  但要求muliindex按顺序排列

  pop[:,2012]

  pop[pop>18]

  pop[['a','b']]