【python】pandas使用-筛选数据
程序员文章站
2022-08-06 22:06:15
import pandas as pd # 将pandas作为第三方库导入,我们一般为pandas取一个别名叫做pdpd.set_option('expand_frame_repr', False) # 当列太多时清楚展示# =====导入数据df = pd.read_csv( # 该参数为数据在电脑中的路径, # 要注意字符串转义符号 \ ,可以使用加r变为raw string或者每一个进行\\转义 # filepath_or_buffer=r'C:\Users\s....
import pandas as pd # 将pandas作为第三方库导入,我们一般为pandas取一个别名叫做pd
pd.set_option('expand_frame_repr', False) # 当列太多时清楚展示
# =====导入数据
df = pd.read_csv(
# 该参数为数据在电脑中的路径,
# 要注意字符串转义符号 \ ,可以使用加r变为raw string或者每一个进行\\转义
# filepath_or_buffer=r'C:\Users\simons\Desktop\xbx_stock_2019\data\a_stock_201903.csv',
filepath_or_buffer=r'/Volumes/LaCie/课程资料/quant_class_code/data/a_stock_201903.csv',
# 编码格式,不同的文件有不同的编码方式,一般文件中有中文的,编码是gbk,默认是utf8
# ** 大家不用去特意记住很多编码,我们常用的就是gbk和utf8,切换一下看一下程序不报错就好了
encoding='gbk',
)
# =====数据筛选,根据指定的条件,筛选出相关的数据。
# print(df['股票代码'] == 'sh600000') # 判断交易股票代码是否等于sh600000
# print(df[df['股票代码'] == 'sh600000']) # 将判断为True的输出:选取股票代码等于sh600000的行
# print(df[df['股票代码'] == 'sh600000'].index) # 输出判断为True的行的index
# print(df[df['股票代码'].isin(['sh600000', 'sh600004', 'sz000001'])]) # 选取股票代码等于'sh600000'或'sh600004'或'sz000001'的都行
# print(df[df['收盘价'] < 10.0]) # 选取收盘价小于10的行
# print(df[(df['收盘价'] < 10.0) & (df['股票代码'] == 'AIDUSD')]) # 两个条件,或者的话就是|
本文地址:https://blog.csdn.net/rikoukai/article/details/109617421
推荐阅读
-
python数据库操作常用功能使用详解(创建表/插入数据/获取数据)
-
Python使用Selenium爬取淘宝异步加载的数据方法
-
python3 json数据格式的转换(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互转换)
-
python数据持久存储 pickle模块的基本使用方法解析
-
对sklearn的使用之数据集的拆分与训练详解(python3.6)
-
python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix实现
-
Windows下Python使用Pandas模块操作Excel文件的教程
-
Windows7下Python3.4使用MySQL数据库
-
详解Python数据分析--Pandas知识点
-
python 使用re.search()筛选后 选取部分结果的方法