Python Pandas用法入门
程序员文章站
2022-03-03 19:55:31
python pandas...
Pandas入门笔记
简介
首先pandas是基于numpy进行开发的。
Pandas 的主要数据结构是 Series(一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。
学过机器学习和深度学习的小伙伴肯定对它都不陌生,为了加深对pandas库的认识和运用,在这里讲它的一些简单用法阐述,也算是一种笔记吧。
数据结构
首先我们知道pandas的数据结构只有两种:series和dataframe——分别对应一维数组和二维异构表单当然它们都是可以加标签的
注意:我们在使用pandas处理数据的时候,一般pandas都会自动创建一个copy对象,来防止对原对象的直接修改
语法入门
这里列出pandas中最常用的几种方法,来帮助小伙伴们快速上手pandas
生成对象
生成一维数组series
我们可以这样生成一个一维数组:
a = pd.Series([])
我们从jupyter notebook中创建一个一维数组并打印它
生成二维DataFrame
与一维数组相同,我们使用DataFrame类来创建对象
df = pd.DataFrame()
这里我们展示两种创建的方法:
通过参数生成、通过series字典对象生成
探索数据
一般我们有以下方法:
- head() : 查看数据的头部
- tail() : 查看数据的尾部(两个括号中可以指定查看的行数,默认为5)
- index:查看索引(列标签)
- colums:查看行标签
- describe():查看数据的统计摘要(当数据很大时非常管用)
- T:转置
- sort_index():按照索引排序
- sort_values():按照值排序
获取数据
- [ ]:通过columns选择单列(b.A等价于b[‘A’])
示例:
- [ : ]:使用切片引用行
示例:
- loc[ , ]:通过指定行列来指定输出
示例:
- isin():筛选指定值
- isna():筛选空值
本文地址:https://blog.csdn.net/Enternalwiser/article/details/108852480
上一篇: 土地公公出来了
下一篇: STM32驱动74HC165原理图加程序