基于Python实现简易文档格式转换器
最近看到市场上各种的文档格式转换软件,要么是收费、要么是有大量的广告。于是学习了一下 pyqt5 的页面操作,再加上了解 pandas 的使用方法。所以,萌生了想法写一个简单的文档格式转换应用。或者有更好的实现方式请在评论区留言,大家一起讨论学习~
需求分析
1、将 .txt 的文本文档转换成 csv 格式文件。
2、将 .txt 的文本文档转换成 excel 格式文件。
开发环境
1、运行环境:python-3.8.x版本
2、操作系统:windows7 系统
3、开发工具:pycharm 2021.1 版本
引用模块
pyqt5 引用的相关模块
from pyqt5.qtwidgets import * from pyqt5.qtcore import * from pyqt5.qtgui import *
系统文件操作引用的模块
import sys import os import pandas as pd
ui界面代码块
设置桌面应用标题
self.setwindowtitle('文本格式转换器') grid = qgridlayout()
创建一个 qtextedit(),将应用中文档格式转换中需要注意的地方以文本的形式进行说明并将其设置为只读模式。
'''文档转换说明''' self.text_current_label = qtextedit() self.text_current_label.setreadonly(true) self.text_current_label.settext('' '1、txt 文本格式说明:每行数据使用英文状态下的逗号","隔开,txt ' '格式的文档是按照每行数据进行读取的,所以需要按照规则进行换行保证每行的数据格式一致。\n' '每行数据举例:zhangsan,21,男,98,优秀\n\n' '2、excel 格式的文档需要事先创建好.xlsx 的空文件(本应用不会自动创建新文件,后期需要可以加上)。\n\n' '3、csv 格式的文档需要事先创建好 .csv 的空文件(本应用不会自动创建新文件,后期需要可以加上)。') self.text_current_label.setstylesheet('color:blue') self.text_current_label.setmaximumheight(90)
读取 .txt 的文本文档文件的按钮,并将文档地址设置到输入框中的操作。因此,需要创建一个文件读取按钮以及只读模式的输入框。
'''.txt 文件''' self.txt_file_path = qlineedit() self.txt_file_path.setreadonly(true) self.txt_file_path_btn = qpushbutton() self.txt_file_path_btn.settext('获取.txt文件') self.txt_file_path_btn.clicked.connect(self.txt_file_path_btn_click)
同样的,分别做 csv 文件和 excel 文件的读取页面设计。
'''.xlsx 文件''' self.xlsx_file_path = qlineedit() self.xlsx_file_path.setreadonly(true) self.xlsx_file_path_btn = qpushbutton() self.xlsx_file_path_btn.settext('获取.xlsx文件') self.xlsx_file_path_btn.clicked.connect(self.xlsx_file_path_btn_click)
'''.csv 文件''' self.csv_file_path = qlineedit() self.csv_file_path.setreadonly(true) self.csv_file_path_btn = qpushbutton() self.csv_file_path_btn.settext('获取.csv文件') self.csv_file_path_btn.clicked.connect(self.csv_file_path_btn_click)
最后,加上文件转换的可选项设计,再添加开始转换的按钮提供应用转换的开始执行的效果。
'''.xlsx .csv 选项 转换按钮''' self.xlsx_checkbox = qcheckbox() self.xlsx_checkbox.settext('.xlsx') self.csv_checkbox = qcheckbox() self.csv_checkbox.settext('.csv') self.trans_btn = qpushbutton() self.trans_btn.settext('开始转换') self.trans_btn.setstylesheet('color:green') self.trans_btn.clicked.connect(self.trans_btn_click)
主要的ui界面相关的设计就是上述这些
格式转换主要代码块
首先,将 .txt 文本文档的文件读取出来,并以 dataframe 的数据格式存放到变量供后面的格式转换使用。
def read_txt_for_dataframe(self): self.columns = [] if self.data_frame_columns_text.text().strip() != '' and self.data_frame_columns_text.text().find(',') != -1: self.columns = self.data_frame_columns_text.text().split(',') self.data_frame = pd.read_csv(self.txt_file_path.text(), encoding='utf-8', index_col=0, names=self.columns) print(self.data_frame) elif self.data_frame_columns_text.text().strip() != '' and self.data_frame_columns_text.text().find(',') == -1: self.warn_dialog_msg('请正确填写数据列!') else: self.data_frame = pd.read_csv(self.txt_file_path.text(), encoding='utf-8', index_col=0) print(self.data_frame)
使用 pandas 模块提供的 csv 文件保存函数进行 .csv 格式的文件保存。
def dataframe_to_csv(self): self.data_frame.to_csv(self.csv_file_path.text())
使用 pandas 模块提供的 excel 文件保存函数进行 .xlsx 格式的文件保存。
def dataframe_to_xlsx(self): self.data_frame.to_excel(self.xlsx_file_path.text())
效果展示
界面风格比较简单,看一下整个应用界面设计是这样的。
以上就是基于python实现简易文档格式转换器的详细内容,更多关于python文档格式转换器的资料请关注其它相关文章!
上一篇: 如何在向量化NumPy数组上进行移动窗口
下一篇: JavaScript文档对象模型DOM