Python 利用数据对比的布尔值对数据进行筛选

程序员文章站 2024-01-27 23:24:16

我们在处理数据时，往往需要删除异常值，异常值有时并不是NAN或者是具体的数字，而是大于某个值的范围，这时，我们可以通过对比结果的布尔值对数据进行筛选；以下，先通过图来说明筛选的重要性：如果没有对数据进行筛选：由于里面有很多异常值，所以我们关心的取值区间就会被异常值遮盖，我们需要的是小于2.5的数据，因此，我们通过筛选，得到的图为：上述两张图所采用的数据是相同的，只不过对数据集通过布尔值进行了筛选，代码如下：df_sum=df_sum[df_sum[4]<=2.5]灵感来自df[df....

我们在处理数据时，往往需要删除异常值，异常值有时并不是NAN或者是具体的数字，而是大于某个值的范围，这时，我们可以通过对比结果的布尔值对数据进行筛选；

以下，先通过图来说明筛选的重要性：
如果没有对数据进行筛选：
Python 利用数据对比的布尔值对数据进行筛选
由于里面有很多异常值，所以我们关心的取值区间就会被异常值遮盖，我们需要的是小于2.5的数据，因此，我们通过筛选，得到的图为：

上述两张图所采用的数据是相同的，只不过对数据集通过布尔值进行了筛选，代码如下：

df_sum=df_sum[df_sum[4]<=2.5]

灵感来自df[df.notnull()]是输出数列中不是空值的值，是输出了df[true]的所有值，因此我们可以考虑将所需的筛选条件写入df[ ]来实现数据筛选的功能

data=pd.Series([1,NA,3.5,NA,7])
print(data)
#
0     1.0
1     NA
2     3.5
3     NA
4     7.0
#
print(data[data.notnull()])
#
0     1.0
2     3.5
4     7.0   
#

df_sum是数据集，[ ]中是df_sum[4]<2.5是df_sum表格的列索引为4的列数据要求小于2.5，判断为True，则将该结果赋值给df_sum实现数据筛选功能

本文地址：https://blog.csdn.net/fuck11111100/article/details/107413430

相关标签：笔记 python 数据分析

上一篇： 20个最新的jQuery插件_jquery

下一篇： asp.net访问网络路径方法(模拟用户登录)

Python 利用数据对比的布尔值对数据进行筛选

我们在处理数据时，往往需要删除异常值，异常值有时并不是NAN或者是具体的数字，而是大于某个值的范围，这时，我们可以通过对比结果的布尔值对数据进行筛选；

Python 利用数据对比的布尔值对数据进行筛选

关于利用Python进行数据分析的方法讲解

利用Python对文件夹下图片数据进行批量改名的代码实例

在Python中利用Into包整洁地进行数据迁移的教程

python3对拉勾数据进行可视化分析的方法详解

python pandas中对Series数据进行轴向连接的实例

利用Python对文件夹下图片数据进行批量改名的代码实例

利用python对Excel中的特定数据提取并写入新表的方法

从贵州茅台上市的第一天起，每天买一手茅台能够盈利多少？-利用python进行茅台股票数据分析

SpringMVC中利用@InitBinder来对页面数据进行解析绑定的方法