欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

pandas 高级二(数据分组,筛选;文件保存)

程序员文章站 2024-03-21 11:22:40
...

以下示例均导入以下包

import pandas as pd
from numpy import nan as Na
import numpy as np
from pandas import DataFrame,Series
import sys

一、数据分组 cut / qcut

1.1 pd.cut
pd.cut(arr,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)
    bins:   序列表示分组边界;
            整数表示个数
    labels: 指定分组名称
    include_lowest: 是否保留分组边界最小的一个值,在bins取整数时无效
    right:          是否保留分组边界中最大的一个值
    presision:      指定分组边界要显示的小数点个数
    retbins:       是否在结果中显示分组边界信息

    right,include_lowest 不会同时为 false:(可以同时为 True)
    优先级:right > include_lowest.

pandas 高级二(数据分组,筛选;文件保存)

11.2 pd.qcut

pandas 高级二(数据分组,筛选;文件保存)
pandas 高级二(数据分组,筛选;文件保存)
pandas 高级二(数据分组,筛选;文件保存)

二、数据过滤与筛选

pandas 高级二(数据分组,筛选;文件保存)

三、pandas 文件读取/存储(IO)

pd.read_csv(filepath_or_buffer="./train_data.txt")
将数据储存到csv:to_csv

pandas 高级二(数据分组,筛选;文件保存)

3.2 文件读取

pandas 高级二(数据分组,筛选;文件保存)

3.3 文件保存

pandas 高级二(数据分组,筛选;文件保存)