欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python去掉索引保存文本写入.txt文件

程序员文章站 2024-01-24 17:16:40
...

这是一个关于.xlsx文件或者是.csv文件处理后,去掉索引,保存成.txt文件的方法。
我是做了一个留言文本处理,数据量500条,我是提取了“留言主题”这一列内容,下面先来看一下我们处理后的文件是怎么样的:

data = pd.read_excel('附件2.xlsx')		#读取文件
comment_data = data.loc[:,['留言主题']]	#只提取评论数据
#去除重复值
comment_data = comment_data.drop_duplicates()
#短句删除
comments = comment_data.iloc[:,0]

看一下comments数据是如何:
python去掉索引保存文本写入.txt文件
大家可以看,这边提取出来的这列,它是旁边有一个索引部分的,好,我们需要的内容找到了,现在保存为txt文件,执行一下以下代码看看结果如何:

f = open("text.txt",'wb')	#打开一个txt文件,如果没有,会自动创建
f.write(comments)			#保存内容
f.close()

python去掉索引保存文本写入.txt文件
看到,我们保存内容的时候,就报错了,显示的是:需要一个类似于bytes的对象,而不是’Series’。
现在我们尝试转换为bytes:

strll = bytes(comments, encoding = "utf8") 

python去掉索引保存文本写入.txt文件
可以看见,不能直接转换。
那么我们换一种方法,办法总比问题多嘛,我们先来看看comments是什么类型:
python去掉索引保存文本写入.txt文件
可以看见,这不是一个字符串类型,那么我们先把它转成字符串类型:

list1 = comments.astype(str).tolist()
strl = ' \n'.join(list1)	
strl
#因为每一行都要换行符,所以需要\n
#如果没有\n,就会变成一片文章,长篇大论的,大家可以尝试一下看看结果

python去掉索引保存文本写入.txt文件
可以看见,我们把这个索引去掉了,接下来就是最后一步了,把str转换为bytes:

strll = bytes(comments, encoding = "utf8") 

就这样就搞定了,ok,我们再来保存一下文件:

f = open("text.txt",'wb')
f.write(strll)
f.close()

看看.txt文件python去掉索引保存文本写入.txt文件
就顺利保存.txt文件。

在写代码过程中呢,通常会遇到很问题,但是,能解决的问题都不是问题,写这篇博客目的:一方面是巩固记忆一些问题,一方面是给各位博友一个方便。

相关标签: python