Pandas数据加载
程序员文章站
2022-03-12 17:57:23
...
Pandas数据加载
pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中read_csv和read_table这两个使用最多。
以下命令都是在浏览器中输入。
cmd命令窗口输入:jupyter notebook
后打开浏览器输入网址http://localhost:8888/
导入包
import pandas as pd
from pandas import DataFrame,Series
read_xxx()参数:
- sep
- header
1、读取.txt文件数据
data=pd.read_csv('./type-.txt')
data
1.1 sep参数
将文件中每一个词作为元素存放在DataFrame中
#sep参数可以多读取到的数据值进行拆分
data=pd.read_csv('./data-07/type-.txt',sep='-')
data
1.2 header参数
#header参数可以设置的列索引
data=pd.read_csv('./type-.txt',sep='-',header=None)
data
2、读取type_comma文件,将每一个数值存放到DataFrame中
data_1=pd.read_csv('./type_comma')
data_1
3、写入excel文件 :df.to_excel(‘name.xlsx’)
#写入
data_1.to_excel('./data.xlsx')
#读取
data=pd.read_excel('./data.xlsx')
data
4、读取sqlite文件
导包 import sqlite3 as sqlite3
import sqlite3 as sqlite3
- 连接数据库
sqlite3.connect(‘dbpath’) - 读取table内容
pd.read_sql(“SQL语句”, con) - 写入数据库文件 df对象.to_sql(name,connection):将df中的数据值写入数据库中,表名为name
- 操作数据库 connection.execute(SQL语句)
4.1 读取
#连接数据库,获取连接对象
conn=sqlite3.connect('./weather_2012.sqlite')
#读取库表中的数据值
sql_df=pd.read_sql('select * from weather_2012',conn)
sql_df.head()
4.2 写入
#将一个df中的数据值写入存储到db
data_1.to_sql('data_1',conn)
#验证:读取文件
pd.read_sql('select * from data_1',conn)
4.3 执行sql语句
conn.execute("delete from data_1 where message ='hello';")
conn.commit()
pd.read_sql('select * from data_1',conn)
5、读取url获取网络上的数据
使用pd.read_csv读取url获取网络上的数据
url='https://raw.githubusercontent.com/datasets/investor-flow-of-funds-us/master/data/weekly.csv'
pd.read_csv(url)
上一篇: For循环实现九九乘法表
下一篇: Pandas数据处理
推荐阅读