python之利用pandas进行数据加载/存储
程序员文章站
2022-06-05 22:25:29
...
一、读写文本格式的数据
1.1 从文件、URL等对象中读写数据
pandas提供了一些用于将表格型数据读取为DataFrame对象的函数:
最常用的两个函数:read_csv和read_table,这两个函数参数及其说明如下:
#从文本文件中读取数据
df=pd.read_csv('data.csv') #数据自带列名
#等效于
#sep指分隔符,对于不是固定的分隔符时,可以编写正则表达式作为分隔符
df=pd.read_table('data.csv',sep=',')
#若数据未带列名,可默认:
df1=pd.read_csv('data1.csv',header=None)
#自定义列名:
df2=pd.read_csv('data1.csv',names=['a','b','c','d','messgae'])
#指定message列(第4列)为列索引,index_col为整数或序列
df3=pd.read_csv('data.csv',index_col=4)
"""
df、df2: df1: df3:
a b c d messgae 0 1 2 3 4 a b c d
0 1 2 3 4 hello 0 1 2 3 4 hello messgae
1 5 6 7 8 world 1 5 6 7 8 world hello 1 2 3 4
2 9 10 11 12 ha 2 9 10 11 12 ha world 5 6 7 8
ha 9 10 11 12
"""
#将数据保存到文本文件中
df3.to_csv('data2.csv')
1.2 从json中读写数据
JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。
Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数:
- json.dumps(): 对数据进行编码。
- json.loads(): 对数据进行解码。
import json
# Python字典类型转换为 JSON 对象
data = {
'no' : 1,
'name' : 'LZH12345',
'url' : 'https://blog.csdn.net/lzh_12345/article/details/79499203'
}
json_str = json.dumps(data)
#json_str:'{"no": 1, "name": "LZH12345", "url": "https://blog.csdn.net/lzh_12345/article/details/79499203"}'
str1=json.loads(json_str)
#str1:{'name': 'LZH12345','no': 1,'url': 'https://blog.csdn.net/lzh_12345/article/details/79499203'}
推荐阅读
-
Python-Pandas-利用append方法进行DataFrame数据添加
-
利用Python进行数据分析_Pandas_处理缺失数据
-
python用pandas数据加载、存储与文件格式的实例
-
《利用Python进行数据分析》第5章 pandas的数据汇总与处理缺失数据
-
利用Python进行数据分析之pandas的高级用法
-
python用pandas实现数据加载、存储与文件格式的教程
-
python之利用pandas进行数据加载/存储
-
利用Python serial和openpyxl模块进行数据的读取和存储
-
python用pandas数据加载、存储与文件格式的实例
-
利用Python进行数据分析_Pandas_处理缺失数据