欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python Pandas用法入门

程序员文章站 2022-03-03 19:55:31
python pandas...



简介

首先pandas是基于numpy进行开发的。

Pandas 的主要数据结构是 Series(一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

学过机器学习和深度学习的小伙伴肯定对它都不陌生,为了加深对pandas库的认识和运用,在这里讲它的一些简单用法阐述,也算是一种笔记吧。

数据结构

首先我们知道pandas的数据结构只有两种:series和dataframe——分别对应一维数组和二维异构表单当然它们都是可以加标签的

注意:我们在使用pandas处理数据的时候,一般pandas都会自动创建一个copy对象,来防止对原对象的直接修改


语法入门

这里列出pandas中最常用的几种方法,来帮助小伙伴们快速上手pandas


生成对象

生成一维数组series

我们可以这样生成一个一维数组:

a = pd.Series([]) 

我们从jupyter notebook中创建一个一维数组并打印它

Python Pandas用法入门

生成二维DataFrame

与一维数组相同,我们使用DataFrame类来创建对象

df = pd.DataFrame() 

这里我们展示两种创建的方法:
通过参数生成、通过series字典对象生成
Python Pandas用法入门

探索数据

一般我们有以下方法:

  • head() : 查看数据的头部
  • tail() : 查看数据的尾部(两个括号中可以指定查看的行数,默认为5)
  • index:查看索引(列标签)
  • colums:查看行标签
  • describe():查看数据的统计摘要(当数据很大时非常管用)
  • T:转置
  • sort_index():按照索引排序
  • sort_values():按照值排序

获取数据

  • [ ]:通过columns选择单列(b.A等价于b[‘A’])

示例:
Python Pandas用法入门


  • [ : ]:使用切片引用行

示例:
Python Pandas用法入门


  • loc[ , ]:通过指定行列来指定输出

示例:
Python Pandas用法入门


  • isin():筛选指定值
  • isna():筛选空值

本文地址:https://blog.csdn.net/Enternalwiser/article/details/108852480