欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python之利用pandas进行数据加载/存储

程序员文章站 2022-06-05 22:25:29
...

一、读写文本格式的数据

1.1 从文件、URL等对象中读写数据

pandas提供了一些用于将表格型数据读取为DataFrame对象的函数:

python之利用pandas进行数据加载/存储

最常用的两个函数:read_csv和read_table,这两个函数参数及其说明如下:

python之利用pandas进行数据加载/存储

python之利用pandas进行数据加载/存储

#从文本文件中读取数据
df=pd.read_csv('data.csv')    #数据自带列名
#等效于
#sep指分隔符,对于不是固定的分隔符时,可以编写正则表达式作为分隔符
df=pd.read_table('data.csv',sep=',')
#若数据未带列名,可默认:
df1=pd.read_csv('data1.csv',header=None)
#自定义列名:
df2=pd.read_csv('data1.csv',names=['a','b','c','d','messgae'])
#指定message列(第4列)为列索引,index_col为整数或序列
df3=pd.read_csv('data.csv',index_col=4)
"""
df、df2:                            df1:                      df3:
   a   b   c   d messgae       0   1   2   3      4               a   b   c   d
0  1   2   3   4   hello    0  1   2   3   4  hello      messgae               
1  5   6   7   8   world    1  5   6   7   8  world      hello    1   2   3   4
2  9  10  11  12      ha    2  9  10  11  12     ha      world    5   6   7   8
                                                         ha       9  10  11  12
"""    
#将数据保存到文本文件中
df3.to_csv('data2.csv')

1.2 从json中读写数据

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。

Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数:

  • json.dumps(): 对数据进行编码。
  • json.loads(): 对数据进行解码。
import json

# Python字典类型转换为 JSON 对象
data = {
    'no' : 1,
    'name' : 'LZH12345',
    'url' : 'https://blog.csdn.net/lzh_12345/article/details/79499203'
}

json_str = json.dumps(data)
#json_str:'{"no": 1, "name": "LZH12345", "url": "https://blog.csdn.net/lzh_12345/article/details/79499203"}'
str1=json.loads(json_str)
#str1:{'name': 'LZH12345','no': 1,'url': 'https://blog.csdn.net/lzh_12345/article/details/79499203'}