欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

原始语料库

程序员文章站 2022-03-03 10:11:42
...

第一步:
判断数据中是否存在重复数据
创建python文件–

代码框架

'''
author: kzb
time: 2018-12-10
'''

import pandas			as pd
import os,csv

dataPath = os.path.join("音译原始数据.csv")

def import_data(dataPath):
	'''
	导入文件中的数据
	return:dataFrame
	'''
	pass

def find_En_Cn_excess(dataFrame):
	'''
	查出EnName、CnName列中存在多余数据的项
	例如:“Abaagu,”、“阿布(教名Abijah、Able、Abner、Absalom的昵称)”
	param:dataFrame
	return:dataFrame
	'''
	pass

def write_to_file(dataFrame):
	'''
	将数据写入文件中
	param:dataFrame
	'''
	pass

def main():
	'''
	程序入口
	'''
	pass

if __name__ == '__main__':
	main()
相关标签: python 数据处理