欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python,pandas缺失值数据处理

程序员文章站 2024-03-24 21:52:28
...

缺失值数据处理方式:
1.数据补齐 2.删除对应数据行 3.不处理

data.csv文件内容:
python,pandas缺失值数据处理

import pandas as pd
'''
uft-8编码:包含全世界所有国家需要用到的字符,英文网站用的较多
gbk编码:包含全部的中文字符
unicode编码:把所有语言统一到一套编码
'''

df=pd.read_csv(r"C:\data\data.csv",encoding='gbk') #pandas默认的编码方式是utf8
#如果python中所要处理的字符串中包含中文,那么最好要搞懂所用字符的编码,是gbk,还是utf-8,否则容易出现乱码,以及语法错误。
#此处如果不写encoding='gbk',会报错((UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte)

python,pandas缺失值数据处理

1.判定空值所在位置

na=df.isnull()
print(na)

python,pandas缺失值数据处理

'''
判断每一行是否有空值
'''
print(na.any(axis=1))#any(iterable) 函数用于判断给定的可迭代参数 iterable 是否全部为False,若是则返回 False,如果有一个为 True,则返回 True。

python,pandas缺失值数据处理

'''
针对某列数据具体判断是否是空值
'''
print(na[['gender']].any(axis=1))

python,pandas缺失值数据处理

2.提取缺失值所在的行

print(df[na[['gender']].any(axis=1)]) #df[逻辑值]

python,pandas缺失值数据处理

3.填充缺失值

df1=df.fillna('1')#所有的空值都填1 。df中的内容没有变。na代表空值

python,pandas缺失值数据处理
python,pandas缺失值数据处理

3.删除缺失值

'''
删除整行数据
'''
df2=df.dropna() #删除空值数据。df中的内容没有改变。

python,pandas缺失值数据处理
python,pandas缺失值数据处理

相关标签: python pandas