欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Pandas读取和存储含有中文的csv文件

程序员文章站 2022-04-19 14:09:18
csv文件的读取和存储问题1.当csv文件中不包含中文时2.当csv文件中含有中文时2.1文件读取2.2文件保存1.当csv文件中不包含中文时这种情况的读取就比较简单了读取:starbucks = pd.read_csv('H:/python数据分析/数据/starbucks.csv')starbucks.head() #显示前五行数据 存储starbucks.to_csv('newdata) # newdata:保存的文件名# 还可以指定保存时的索引要不要starbucks.t...

1.当csv文件中不包含中文时

这种情况的读取就比较简单了
读取:

starbucks = pd.read_csv('H:/python数据分析/数据/starbucks.csv')
starbucks.head()   #显示前五行数据 

存储

starbucks.to_csv('newdata)   # newdata:保存的文件名
# 还可以指定保存时的索引要不要
starbucks.to_csv('newdata,index=False) # 保存时不显示index(索引)值

2.当csv文件中含有中文时

2.1文件读取
  • 读取带有中文的csv文件时,需要加上 engine=‘python’
out = pd.read_csv('D:/MyData/Jupyter notebook/数据分析/newout1.csv',engine='python')
out
  • 如果还不行则再加上encoding=‘utf-8’
out = pd.read_csv('D:/MyData/Jupyter notebook/数据分析/newout1.csv',engine='python',encoding='utf-8')
out
  • 有时候会发现这样还是不行,那就再把 encoding='utf-8’换成 encoding='utf-8-sig’试试,这样应该可以解决大部分的读取问题
out = pd.read_csv('D:/MyData/Jupyter notebook/数据分析/newout1.csv',engine='python',encoding='utf-8-sig')
out
  • 如果你的文件是’gbk’格式的话,那么你可以试试用encoding=‘gbk’
out = pd.read_csv('D:/MyData/Jupyter notebook/数据分析/newout1.csv',engine='python',encoding='gbk')
out
2.2文件保存
  • 同样保存带有中文的csv文件需要加上encoding=‘utf-8’,否则文件打开后会出现中文乱码的情况
out.to_csv('new_out.csv',index=False,encoding='utf-8')
  • 如果乱码问题还未解决,试试encoding=‘utf-8-sig’,一般都能解决,反正我试过好多遍了,没有问题
out.to_csv('new_out2.csv',index=False,encoding='utf-8-sig')

本文地址:https://blog.csdn.net/qq_44372971/article/details/107168587