pandas读写文本(csv)文件
CSV文件是一种纯文本文件,可以使用任何文本编辑器进行编辑,它支持追加模式,节省内存开销。因为csv文件具有诸多的优点,所以在很多时候会将数据保存到csv文件中。
Pandas中提供了read_csv()函数与to_csv()方法,分别用于读取CSV文件和写入CSV文件,关于他们的具体介绍如下:
1.通过to_csv()方法将数据写入CSV文件
to_csv(path_or_buf=None,sep=‘,’,na_rep=’’,float_format=None,columns=None,header=True,index=True,index_label=None,mode=‘w’,encoding=None,compression=None,quoting=None,quotechar=’“”’,line_terminator=’\n’,chunksize=None,tuplesize_cols=None,date_format=None,doublequote=True,escapechar=None,decimal=’.’)
(1)path_or_buf:文件路径
(2)index:布尔值,默认为True。如果为False,则将不会显示索引
(3)sep:分隔符,默认用 " . " 隔开
如果指定的路径下文件不存在,则会创建一个文件来保存数据;如果文件已经存在,则会将文件中的内容进行覆盖。
接下来,通过一段代码来演示将DataFrame对象中的数据写入到CSV文件中:
2.通过read_csv()函数读取CSV文件的数据;read_csv()函数的作用是将CSV文件的数据读取出来,并转换成DataFrame对象。read_csv()函数的语法:read_csv(filepath_or_buffer,sep=",",delimiter=None,header=“infer”,names=None,index_col=None,usecols=None,squeeze=False,perfix=None,mangle_dupe_cols=True,dtype=None…)
上述函数中常用参数表示的含义如下:
(1)filepath_or_buffer:表示文件路径,可以为URL字符串
(2)sep:分隔符,默认用 " ," 隔开
(3)header:指定行数用来作为列名,如果读取的文件中没有列名,则默认为0,否则设置为None //指定的行数如果在中间行,上面的行不要,拿它下面的行作为数据,自己做为列名,反正处于它下面的才会要
(4)names:用于结果的列名列表。如果文件不包含标题行,则应该将该参数设置为None
(5)index_col:用作行索引的列编号或者列名,如果给定一个序列,则表示有多个行索引 //index_col=多少,就把那一列作为索引列,比如index_col=1,把1作为索引列
接下来,使用read_csv()函数将文件读取出来:
#read_table()和 read_csv()的区别在于使用的分隔符不同,前面为",",后面为"\t"
header参数用法:
index_col参数的用法: