python:pandas合并csv文件的方法(图书数据集成)
程序员文章站
2023-01-01 09:51:23
数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。
两张表:readerinformation.csv,readerrentrecode.csv...
数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。
两张表:readerinformation.csv,readerrentrecode.csv
readerinformation.csv:
readerrentrecode.csv:
pandas读取csv文件,并进行csv文件合并处理:
# -*- coding:utf-8 -*- import csv as csv import numpy as np # ------------- # csv读取表格数据 # ------------- ''' csv_file_object = csv.reader(codecs.open('readerrentrecode.csv', 'rb')) header = csv_file_object.next() print header print type(header) print header[1] data = [] for row in csv_file_object: data.append(row) data = np.array(data) print data[0::, 0] ''' # ------------- # pandas读取表格数据 # ------------- import pandas as pd df = pd.read_csv('readerrentrecode.csv') # 读者借阅信息表 ''' print df.head() print '----------------' print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列 print '------------------------------------------------------------------' print ''' dd = pd.read_csv('readerinformation.csv') ''' print dd.head() print '----------------' print dd[['读者证号', '读者性别', '读者单位', '读者类别']] print '------------------------------------------------------------------' print ''' data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接 data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']] print data print '------------------------------------------------------------------' print # ------------- # pandas写入表格数据 # ------------- data.to_csv(r'data.csv', encoding='gbk')
合并后的csv文件:data.csv
通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。
以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
推荐阅读
-
python 利用pandas将arff文件转csv文件的方法
-
Python之csv文件从MySQL数据库导入导出的方法
-
Python3:将list数据以csv文件导出的方法
-
Python Pandas批量读取csv文件到dataframe的方法
-
Python实现将MySQL数据库表中的数据导出生成csv格式文件的方法
-
python:pandas合并csv文件的方法(图书数据集成)
-
使用pandas将numpy中的数组数据保存到csv文件的方法
-
Python导出数据到Excel可读取的CSV文件的方法
-
Python使用cx_Oracle模块将oracle中数据导出到csv文件的方法
-
使用python的pandas库读取csv文件保存至mysql数据库