Pandas DataFrame 基础知识
程序员文章站
2024-01-05 12:19:10
...
jupyter文件在这里。本文还参考了****1。
引入包并导入数据
import pandas as pd
df = pd.read_csv('sample.csv')
查看原始数据
function | description | return type |
---|---|---|
df.head(n) | 查看前n行,n不写则查看所有行 | DataFrame |
df.tail(n) | 查看后n行,n不写则查看所有行 | DataFrame |
df.shape | 查看row和column数 | tuple |
df.index | 查看index | RangeIndex |
df.columns | 查看columns | Index |
df[n:m] | slice风格查看第n到第m行(不包括第m行) | DataFrame |
df.column_name | 查看某column数据 | Series |
df[‘column_name’] | 同上 | Series |
df[[‘column_name1’( ,‘column_name2( , …)’]] | 查看多列数据 | DataFrame |
连续使用上面倒数四种函数可以获取指定位置的数据。具体要看type。
# 查看指定位置数据的例子
df[['column_name']][n:m]
查看统计信息
function | description |
---|---|
df.describe() | 查看简单统计信息 |
df.max() | 最大值 |
df.min() | 最小值 |
df.mean() | 平均值 |
SQL风格数据查询
df[['name','age']][df['salary']>df['salary'].mean()]
set_index()/reset_index()
df = set_index('id', inplace = True)
如果inplace参数为True,则在原DataFrame上做如下修改:
如不想修改原DataFrame,可另inplace = False:
df2 = df.set_index('id', inplace=False)
上一篇: mysql ifelse流程控制语句
下一篇: 手机尾号评分