欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Pandas DataFrame 基础知识

程序员文章站 2024-01-05 12:19:10
...

jupyter文件在这里。本文还参考了****1

引入包并导入数据

import pandas as pd
df = pd.read_csv('sample.csv')

Pandas DataFrame 基础知识

查看原始数据

function description return type
df.head(n) 查看前n行,n不写则查看所有行 DataFrame
df.tail(n) 查看后n行,n不写则查看所有行 DataFrame
df.shape 查看row和column数 tuple
df.index 查看index RangeIndex
df.columns 查看columns Index
df[n:m] slice风格查看第n到第m行(不包括第m行) DataFrame
df.column_name 查看某column数据 Series
df[‘column_name’] 同上 Series
df[[‘column_name1’( ,‘column_name2( , …)’]] 查看多列数据 DataFrame

连续使用上面倒数四种函数可以获取指定位置的数据。具体要看type。

# 查看指定位置数据的例子
df[['column_name']][n:m]

查看统计信息

function description
df.describe() 查看简单统计信息
df.max() 最大值
df.min() 最小值
df.mean() 平均值

SQL风格数据查询

df[['name','age']][df['salary']>df['salary'].mean()]

set_index()/reset_index()

df = set_index('id', inplace = True)

如果inplace参数为True,则在原DataFrame上做如下修改:
Pandas DataFrame 基础知识
如不想修改原DataFrame,可另inplace = False:

df2 = df.set_index('id', inplace=False)

  1. Python Pandas Tutorial 2: Dataframe Basics ↩︎

相关标签: 数据分析 python