欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Pandas 将gbk和utf-8 的文件格式转换出错时的解决方法(windows)

程序员文章站 2024-03-24 11:55:34
...

在Windows 下,进行utf-8 格式的相关转换时需要注意,许多编译器默认windows上的是ANSI编码的而非utf-8格式,这会导致绝大多数情况下BOM会丢失

因此在windows下进行转换时,要写清楚,比如我有一个gbk格式的csv文件,需要按照如下方式进行转换

import pandas as pd
df = pd.read_csv(path,encoding="gbk")
df.to_csv(path,encoding="utf-8-sig")

如果to_csv 里面直接写encoding=“utf-8” 转出来的结果会有乱码