欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

pandas常用API_1

程序员文章站 2022-05-04 11:24:24
pandas 数据分析处理库 "pandas官方网站" "pandas中文网" API 说明: import pandas as pd df_obj: DataFrame对象(表格型的数据结构,提供有序的列和不同类型的列值) s_obj: series对象(一维数组对象,包含一组索引和一组数据) 1 ......

pandas

数据分析处理库


api

说明:
import pandas as pd
df_obj: dataframe对象(表格型的数据结构,提供有序的列和不同类型的列值)
s_obj: series对象(一维数组对象,包含一组索引和一组数据)
1. pd.read_csv(filepath_or_buffer, ...)
  将csv文件读取到dataframe中。
常用参数:
   filepath_or_buffer:任何有效的字符串路径;也可以是url,有效的url方案包括:http, ftp, s3 和 file.
返回值:
  dataframe or textparser
2. df_obj.head(n:int=5)/s_obj.head(n:int=5)
  返回前n行。
参数:
  n:int, default:5; 返回前多少行。
返回值:
  same type as caller。
3. pd.value_counts(values, sort:bool=true, ascending:bool=false, normalize:bool=false, bins=none, dropna:bool=true)
  返回一个包含唯一值计数的series, 结果降序排列,不包含nan值。
参数:
  values: 要统计计数的数据
  sort: bool类型,是否按频率排序,默认为true.
  ascending: bool类型,升序排列,默认为false.
  normalize: bool类型,是否显示频率,默认为false.
  bins: int类型,不再是按值统计计数,而是将区间均分为几等分,统计每个区间中的计数。
  dropna: bool类型,不包括nan计数,默认为true.
返回值:
  series.
4. df_obj / s_obj.sort_index(axis=0, level=none, ascending=true, inplace=false, kind="quicksort", na_position="last", sort_remaining=true, ignore_index=false)
  按索引标签对序列进行排序。
参数:
  axis: 进行排序的轴(0/index:行,1/columns:列),默认为0.
  level: int / 级别名称 / 级别列表 / 级别名称列表;如果不是none, 则对索引级别中的值进行排序。
  ascending: 升序排序,默认为true。
  inplace: 如果为true, 则就地执行操作(改变原序列),默认为false(生成一个排序后的新列)。
  kind: 选择排序算法。(quicksort, mergesort, heapsort), 对于dataframe, 仅对单个列或标签排序时适用。
  na_position:last / first; nan放在开头还是结尾,默认为last.
  sort_remaining: 默认为false, 如果为true且级别或索引是多层的,则按指定级别排序后也按其他级别排序。
  ingore_index: 默认为false, 如果为true, 则结果轴将标记为0,1,2,..., n-1.