Pandas 将gbk和utf-8 的文件格式转换出错时的解决方法(windows)
程序员文章站
2024-03-24 11:55:34
...
在Windows 下,进行utf-8 格式的相关转换时需要注意,许多编译器默认windows上的是ANSI编码的而非utf-8格式,这会导致绝大多数情况下BOM会丢失
因此在windows下进行转换时,要写清楚,比如我有一个gbk格式的csv文件,需要按照如下方式进行转换
import pandas as pd
df = pd.read_csv(path,encoding="gbk")
df.to_csv(path,encoding="utf-8-sig")
如果to_csv 里面直接写encoding=“utf-8” 转出来的结果会有乱码