欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python数据分析基础之文件的读取

程序员文章站 2022-03-07 08:13:59
目录一·numpy库中操作文件1.操作csv文件2.在pycharm中操作csv文件3.其他情况(.npy类型文件)二·pandas库中操作文件1.操作csv文件2.从剪贴板上复制数据3.读取exce...

前言:如果你使用的是anaconda中的jupyter,则不需要下载pands和numpy库;如果你使用的是pycharm或其他集成环境,则需要pands和numpy库

一·numpy库中操作文件

1.操作csv文件

import numpy as np
a=np.random.randint(0,10,size=(3,4))
np.savetext("score.csv",a,deliminter=",")

a:自己随便创建的数组,deliminter:分隔符,score:要读取的文件名

或者

import numpy as np
data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)

skiprows:跳过第一行,dtype:数据读出的类型为字符型

2.在pycharm中操作csv文件

import csv
with open("score.csv",'r')as fp:
reader=csv.reader(fp)
for x in reader:
     print(x)

reader:迭代器

3.其他情况(.npy类型文件)

import numpy as np
c=np.random.randint(0,10,size=(2,3))
np.save("文件名",c)
c1=np.load("文件名.npy")

二·pandas库中操作文件

1.操作csv文件

import pandas as pd
df=pd.read_csv("exl.csv")

或者

import pandas as pd
pd.read_table("exl.csv",sep=',')

sep:分隔符

2.从剪贴板上复制数据

import pandas as pd
bs=pd.read_clipboard

3.读取excel或xlsx文件

import pandas as pd
df=read_excel("exl.xlsx")

三·补充

1.常用

import os
os.chdir()

chdir()中写上你想读取文件的目录,表示将目录转化到你想读取文件的目录.

2.pandas中读取文件的函数

  • read_csv  从文件,url,文件型对象中加载带分隔符的数据。默认分隔符为逗号
  • read_table   同上,但默认分隔符为制表符(“t”)
  • read_fwf  读取定宽列格式数据(无分隔符)
  • read_clipboard  读取剪贴板中的数据
  • read_excel  从excel 或xlsx文件中读取表格数据
  • read_hdf   读取pandas写的hdf5文件
  • read_html  读取html文档中的所以表格
  • read_json    读取json字符串中的数据
  • read_msgpack 二进制格式编码的pandas数据
  • read_pickle  读取python pickle 格式中存储的任意对象
  • read_sas   读取存储于sas系统自定义存储格式为sas数据集
  • read_sql   读取sql查询结果为pandas的dataframe
  • read_stata 读取stata文件格式的数据集

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注的更多内容!