python将当所有txt文件另存为utf-8格式
程序员文章站
2022-06-15 19:38:11
今天遇到需要转换txt保存格式的问题,如果文件很少可以使用“记事本”-另存为功能保存,也可以使用notepad++--编码--转为xx编码,但是文件很多时这种方法就不可取了。之前查了一下bat脚本,对bat脚本不熟,而且语法很难懂,所以就选择python脚本实现了。下面的脚本自动获取文件编码格式,然后转化成UTF-8格式保存。import os#files = os.listdir(".")#获取当前目录下的文件from chardet.universaldetector import U...
今天遇到需要转换txt保存格式的问题,如果文件很少可以使用“记事本”-另存为功能保存,也可以使用notepad++--编码--转为xx编码,但是文件很多时这种方法就不可取了。
之前查了一下bat脚本,对bat脚本不熟,而且语法很难懂,所以就选择python脚本实现了。
下面的脚本自动获取文件编码格式,然后转化成UTF-8格式保存。
import os
#files = os.listdir(".")#获取当前目录下的文件
from chardet.universaldetector import UniversalDetector
def get_filelist(path):
Filelist = []
for home, dirs, files in os.walk(path):
for filename in files:
# 文件名列表,包含完整路径
if ".txt" in filename:
Filelist.append(os.path.join(home, filename))
# # 文件名列表,只包含文件名
# Filelist.append( filename)
return Filelist
def get_encode_info(file):
with open(file, 'rb') as f:
detector = UniversalDetector()
for line in f.readlines():
detector.feed(line)
if detector.done:
break
detector.close()
return detector.result['encoding']
def read_file(file):
with open(file, 'rb') as f:
return f.read()
def write_file(content, file):
with open(file, 'wb') as f:
f.write(content)
def convert_encode2utf8(file, original_encode, des_encode):
file_content = read_file(file)
file_decode = file_content.decode(original_encode,'ignore')
file_encode = file_decode.encode(des_encode)
write_file(file_encode, file)
if __name__ == "__main__":
filePath = './'
Filelist = get_filelist(filePath)
for filename in Filelist:
file_content = read_file(filename)
encode_info = get_encode_info(filename)
if encode_info != 'utf-8':
convert_encode2utf8(filename, encode_info, 'utf-8')
encode_info = get_encode_info(filename)
print(encode_info)
本文地址:https://blog.csdn.net/juluwangriyue/article/details/109053440
上一篇: SSIM---结构相似性算法(OpenCV+Python)
下一篇: js基础语法之变量类型和计算
推荐阅读
-
使用python将歌词文件(.lrc文件)转换成字典及遍历获取文件夹内所有lrc文件并以lrc格式显示出来
-
Python读取指定路径所有.txt文件,将文件名写入.txt
-
解决python将xml格式文件转换成txt文件的问题(xml.etree方法)
-
python将当所有txt文件另存为utf-8格式
-
python将csv格式文件转存为txt文件
-
使用python将歌词文件(.lrc文件)转换成字典及遍历获取文件夹内所有lrc文件并以lrc格式显示出来
-
Python读取指定路径所有.txt文件,将文件名写入.txt
-
python将字符串以utf-8格式保存在txt文件中的方法
-
Python将文件夹目录下所有txt格式文件转成csv文件
-
解决python将xml格式文件转换成txt文件的问题(xml.etree方法)