欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

pandas 数据读取与保存

程序员文章站 2022-06-23 10:03:25
pandas 数据读取与保存一:读取表格数据例:在一个text.xlsx文件中,有text1,text2,text3三张表格sheetname切换sheet表格可以传入整形,表示从0开始的索引pd.read_excel(r"text.xlsx",sheetname=1)可以传入表名称pd.read_excel(r"text.xlsx",sheetname="text1")可以传入list,混合使用,如[“sheetname”,2]pd.read_excel(r"tex...

pandas 数据读取与保存

一:读取表格数据

例:在一个text.xlsx文件中,有text1,text2,text3三张表格

  1. sheetname

    切换sheet表格

    • 可以传入整形,表示从0开始的索引
    pd.read_excel(r"text.xlsx",sheet_name=1)
    
    • 可以传入表名称
    pd.read_excel(r"text.xlsx",sheet_name="text1")
    
    • 可以传入list,混合使用,如[“sheet_name”,2]
    pd.read_excel(r"text.xlsx",sheet_name=[1,"text1"])
    
    • 可以传入None,表示一次性获取所有表格,返回的是一个字典类型,字典的key为表的名称,字典的value为表格数据
    pd.read_excel(r"text.xlsx",sheet_name=None)
    

    查看当前表格的名字

    keys()方法仅限于读取多个表格时使用

    list(data.keys()
    

    查看某张表的数据

    仅限读取了多个表格时使用

    data["text1"]
    
  2. header

    指定表格中的某一行作为表头,即列索引。默认header=0,将第一行作为表头,当headers不为0时,会将表头行之前的行全部删掉。

    pd.read_excel(r"text.xlsx",header=1)
    
  3. names

    当我们需要自定义表头时,可以用names传递一个列表来作为表头。传递前必须将header的值设置为None。列表中headername的个数必须与列数相等。

    pd.read_excel(r"text.xlsx",header=None,names=[header_name])
    
  4. skiprows

    跳过(删除)指定的行数,将剩下的行数中的第一行作为表头,并且剩下的表格的行索引会重新进行排序

    # 将第1行和第10行删除,然后将剩下的第一行作为表头
    data = pd.read_excel(r"text.xlsx",skiprows=[1,10])
    
  5. head

    默认取表格前5行数据,可指定行数

    data.head(10)
    
  6. tail

    默认取表格后5行数据,可指定行数

    data.tail(10)
    

二:读取csv文件

  1. csv属于文本文件,逗号分隔符文件,编码一般为gbk

    sep:元素分隔符,在csv文件中默认分隔符为","

    engine:底层编译方式,默认为c语言,如果遇到编码问题,可以尝试将engine改为python

    csv_file = pd.read_csv(r"file_name",sep=",",encoding="gbk",engine="python")
    
  2. 保存文件

    文件名要加后缀

    # 保存为xlsx文件
    csv_file.to_excel("file_name")
    # 保存为csv文件
    csv_file.to_csv("file_name")
    

本文地址:https://blog.csdn.net/weixin_46297209/article/details/111996779