Pandas 基本数据结构
程序员文章站
2022-03-27 21:06:08
pandas基本数据结构: Series 和DataFrame...
目录
基本数据结构
- Series: 具有轴标签(包括时间序列)的一维数组
- DataFrame: 具有轴标签, 二维,大小可变, 异构的表格数据。可以视作Series的容器,是pandas主要的数据结构
1. 初识Series
创建一个Series
import pandas as pd
import numpy as np
s = pd.Series(np.random.randint(1,18,size=3),index=['a','b','c'],name='Random int64 Series',dtype='int64')
print(s)
a 17
b 7
c 6
Name: Random int64 Series, dtype: int64
简单访问Series的属性方法
# dir(s) 查看所有属性和方法
print("索引:")
print(s.index)
print("\n取值,根据索引取值:")
print(s['b'])
print("\nvalues: ")
print(s.values)
# 平均值,注意这里Series是random出来的,所以你运行得到的平均值可能不一样
print("\n平均值")
print(s.mean())
索引:
Index(['a', 'b', 'c'], dtype='object')
取值,根据索引取值:
7
values:
[17 7 6]
平均值
10.0
2. 初识DataFrame
创建一个DataFrame
df = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
... columns=['a', 'b', 'c'])
print(df)
a b c
0 1 2 3
1 4 5 6
2 7 8 9
简单访问DataFrame的属性方法
# dir(df) 查看所有属性和方法
print("索引:")
print(df.index)
print("\n取值,根据索引取值:")
print(df['a'])
print("\nvalues: ")
print(df.values)
# 平均值,注意这里Series是random出来的,所以你运行得到的平均值可能不一样
print("\n平均值")
print(df.mean())
索引:
RangeIndex(start=0, stop=3, step=1)
取值,根据索引取值:
0 1
1 4
2 7
Name: a, dtype: int32
values:
[[1 2 3]
[4 5 6]
[7 8 9]]
平均值
a 4.0
b 5.0
c 6.0
dtype: float64
我是总结
- 认识了pandas两个基本数据结构: Series和DataFrame
- 学习了Series和DataFrame的基本用法
扫码关注公众号: 风起帆扬了
来一起学习,成长,分享
航行在测试的大道上
喜欢就点赞吧
本文地址:https://blog.csdn.net/keithsoul/article/details/110881469