原始语料库
程序员文章站
2022-03-03 10:11:42
...
第一步:
判断数据中是否存在重复数据
创建python文件–
代码框架
'''
author: kzb
time: 2018-12-10
'''
import pandas as pd
import os,csv
dataPath = os.path.join("音译原始数据.csv")
def import_data(dataPath):
'''
导入文件中的数据
return:dataFrame
'''
pass
def find_En_Cn_excess(dataFrame):
'''
查出EnName、CnName列中存在多余数据的项
例如:“Abaagu,”、“阿布(教名Abijah、Able、Abner、Absalom的昵称)”
param:dataFrame
return:dataFrame
'''
pass
def write_to_file(dataFrame):
'''
将数据写入文件中
param:dataFrame
'''
pass
def main():
'''
程序入口
'''
pass
if __name__ == '__main__':
main()
下一篇: 两个二维数组一一对应合成一个三维数组