pandas 高级二(数据分组,筛选;文件保存)
程序员文章站
2024-03-21 11:22:40
...
以下示例均导入以下包
import pandas as pd
from numpy import nan as Na
import numpy as np
from pandas import DataFrame,Series
import sys
一、数据分组 cut / qcut
1.1 pd.cut
pd.cut(arr,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False) bins: 序列表示分组边界; 整数表示个数 labels: 指定分组名称 include_lowest: 是否保留分组边界最小的一个值,在bins取整数时无效 right: 是否保留分组边界中最大的一个值 presision: 指定分组边界要显示的小数点个数 retbins: 是否在结果中显示分组边界信息 right,include_lowest 不会同时为 false:(可以同时为 True) 优先级:right > include_lowest.
11.2 pd.qcut
二、数据过滤与筛选
三、pandas 文件读取/存储(IO)
pd.read_csv(filepath_or_buffer="./train_data.txt") 将数据储存到csv:to_csv
3.2 文件读取
3.3 文件保存