欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python-csv格式转tsv格式

程序员文章站 2022-06-01 14:06:28
...

原文链接 http://chenhao.space/post/b7b37f12.html

.csv to .tsv

这是一个CSV格式的文件:

Python-csv格式转tsv格式

我想要提取出表头为rating和comment的数据,并且转为tsv格式。

首先,提取rating和comment数据:

import pandas

path = './MovieRatings.csv'
pd_all = pd.read_csv(path)
pd_all.to_csv('./MOVIE.csv', header=None, index=False, columns=["rating", "comment"], mode="w")

现在我们就得到了MOVIE.csv文件了,并且去掉了表头(header=None):

Python-csv格式转tsv格式

接下来将它转成tsv格式文件:

csv.writer(open('/Users/chenhao/项目/数据整理/Movie/MOVIE.tsv', 'w+'), delimiter='\t').writerows(csv.reader(open("/Users/chenhao/项目/数据整理/Movie/MOVIE.csv")))

Python-csv格式转tsv格式

但是数据的分隔好像是\t还多了个空格符,不太清楚怎么回事。

还有一种办法转换csv to tsv,而且更简单:

MOVIE_train.to_csv("MOVIE_5_train_seg.tsv", sep="\t", header=None, index=False, mode="w+")

MOVIE_train是我已经读取的csv文件,这样生成的tsv好像也还是\t后面多了一个空格符。


其他

读取csv文件不想读取表头,可以设置header=-1。

相关标签: csv