python数据分析-pandas模块基础知识(1)
呀~博主是正在学习数据分析的一员,记录的是自己学习过程中总结的知识点,肯定有不完善的地方,如有问题可以私聊我改正,共同学习进步。希望大家都能保持学习的热情,坚持自己,不断超越自己!
博客地址:qxi的博客
#今天就开始总结pandas模块的基础知识啦~#
为了入门pandas,需要熟悉两个常用的工具数据结构,Series
和DataFrame
。尽管他们并不能解决所有的问题,但它们为大多数应用提供了一个有效、易用的基础。
这篇文章先介绍Series,Series是一种一维数组型对象,它包含了一个值序列
(与numpy中的类型相似),并且包含了数据标签,称为索引
(index)。换个角度考虑Series,可以认为它是一个长度固定且有序的字典
,因为它将索引值以及序列值按位置配对。
PS:文中的pd代表模块pandas
①直接用pd.Series()
函数就可以生成Series了,可以看到索引值在左边,序列值在右边,当不知道索引时,默认生成的索引是从0到N-1(N是数据的长度)。可以通过values
属性以及index
属性分别获取Series对象的值和索引。
import pandas as pd
s=pd.Series([12,3,5,-7]) #括号里是一维数组,就是一个序列
print(s)
print(s.values)
print(s.index)
运行结果:
0 12
1 3
2 5
3 -7
dtype: int64 #数据类型
[12 3 5 -7] #获取序列值
RangeIndex(start=0, stop=4, step=1) #获取索引值,与range(4)类似
②利用index=[]
对Series对象指定索引
import pandas as pd
s=pd.Series([12,3,5,-7],index=['a','b','c','d'])
print(s)
运行结果:
a 12
b 3
c 5
d -7
dtype: int64
③利用索引标签进行索引,提取出数据[‘a’,’b’,’c’]
包含的不是数字而是字符串,作为索引列表
import pandas as pd
s=pd.Series([12,3,5,-7],index=['a','b','c','d'])
print(s)
print(s['a'])
print(s[['a','b','c']]) #两个中括号
运行结果:
a 12
b 3
c 5
d -7
dtype: int64
12 #s['a']结果
a 12
b 3
c 5 #s[['a','b','c']]结果
④对数据进行更改,类似字典中更改值的操作
import pandas as pd
s=pd.Series([12,3,5,-7],index=['a','b','c','d'])
print(s)
s['a']=10 #对数据进行更改,类似字典的操作
print(s['a'])
运行结果:
a 12
b 3
c 5
d -7
dtype: int64
10
⑤使用布尔值数组进行过滤,与标量相乘,或者是应用数学函数对Series对象进行操作
import pandas as pd
import numpy as np
s=pd.Series([12,3,5,-7],index=['a','b','c','d'])
print(s>0) #仅仅是判断而已,返回True或者False
print(s[s>0]) #判断并提取出来
print(s*10) #乘上10
print(np.exp(s))
运行结果:
a True
b True
c True
d False
dtype: bool
a 12
b 3
c 5
dtype: int64
a 120
b 30
c 50
d -70
dtype: int64
a 162754.791419
b 20.085537
c 148.413159
d 0.000912
dtype: float64
如果觉得对你有一点点帮助的话记得点赞哟~
本文地址:https://blog.csdn.net/hswqxi/article/details/107368822
上一篇: 水果o2o微店系统怎么开发?