通过Pandas读取大文件的实例

程序员文章站 2023-09-01 14:22:18

当数据文件过大时，由于计算机内存有限，需要对大文件进行分块读取： import pandas as pd f = open('e:/学习相关/python/数据...

当数据文件过大时，由于计算机内存有限，需要对大文件进行分块读取：

import pandas as pd
f = open('e:/学习相关/python/数据样例/用户侧数据/test数据.csv')
reader = pd.read_csv(f, sep=',', iterator=true)
loop = true
chunksize = 100000
chunks = []
while loop:
 try:
 chunk = reader.get_chunk(chunksize)
 chunks.append(chunk)
 except stopiteration:
 loop = false
 print("iteration is stopped.")
df = pd.concat(chunks, ignore_index=true)
print(df)

read_csv()函数的iterator参数等于true时，表示返回一个textparser以便逐块读取文件；

chunksize表示文件块的大小，用于迭代；

textparser类的get_chunk方法用于读取任意大小的文件块；

stopiteration的异常表示在循环对象穷尽所有元素时报错；

concat()函数用于将数据做轴向连接：

pd.concat(objs, axis=0, join='outer', join_axes=none, ignore_index=false, keys=none, levels=none, names=none, verify_integrity=false)

常用参数：

objs：series,dataframe或者是panel构成的序列list;

axis：需要合并连接的轴，0是行，1是列；

join：连接的参数，inner或outer；

ignore=true表示重建索引。

以上这篇通过pandas读取大文件的实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

上一篇：微信小程序实战–集阅读与电影于一体的小程序项目（六）

下一篇：过敏性鼻炎的治疗方法六大方法治疗过敏性鼻炎

通过Pandas读取大文件的实例

通过实例浅析Python对比C语言的编程思想差异

通过jxl.jar 读取、导出excel的实例代码

Android开发中通过手机号+短信验证码登录的实例代码

python简单读取大文件的方法

C#实现xml文件的读取与写入简单实例

Android通过手势实现的缩放处理实例代码

JavaScript通过改变文字透明度实现的文字闪烁效果实例

java 读取excel文件转换成json格式的实例代码

C#中通过使用Connection类来实现打开/关闭数据库的代码实例

Python通过RabbitMQ服务器实现交换机功能的实例教程