欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

第一章 pandas基础

程序员文章站 2022-04-24 16:22:07
...

问题

【问题一】 Series和DataFrame有哪些常见属性和方法?

对于一个Series,其中最常用的属性为:值(values),索引(index),名字(name),类型(dtype)

DataFrame的常见属性:

第一章 pandas基础

【问题二】 value_counts会统计缺失值吗?

不会统计缺失值

【问题三】 与idxmax和nlargest功能相反的是哪两组函数?
idxmin和nsmallest
【问题四】 在常用函数一节中,由于一些函数的功能比较简单,因此没有列入,现在将它们列在下面,请分别说明它们的用途并尝试使用。
sum/mean/median/mad(求平均绝对偏差)/min/max/abs/std/var/quantile/cummax/cumsum/cumprod(通过DataFrame或Series轴返回累积乘积)

【问题五】 df.mean(axis=1)是什么意思?它与df.mean()的结果一样吗?第一问提到的函数也有axis参数吗?怎么使用?
df.mean(axis=1) #按行求平均值
df.mean()  #默认axis=0(列),即按列求平均值
可以有,将参数设置为axis = 1


练习


【练习一】 现有一份关于美剧《权力的游戏》剧本的数据集,请解决以下问题:
(a)在所有的数据中,一共出现了多少人物?

df = pd.read_csv('data/Game_of_Thrones_Script.csv')
df.head()

第一章 pandas基础

df['Name'].nunique()

(b)以单元格计数(即简单把一个单元格视作一句),谁说了最多的话?

df['Name'].value_counts().index[0]

【练习二】现有一份关于科比的投篮数据集,请解决如下问题:

(a)哪种action_type和combined_shot_type的组合是最多的?

df = pd.read_csv('data/Kobe_data.csv',index_col='shot_id')
df.head()

(b)在所有被记录的game_id中,遭遇到最多的opponent是一个支?

pd.Series(list(zip(df['action_type'],df['combined_shot_type']))).value_counts().index[0]

第一章 pandas基础