python,pandas缺失值数据处理
程序员文章站
2024-03-24 21:52:28
...
缺失值数据处理方式:
1.数据补齐 2.删除对应数据行 3.不处理
data.csv文件内容:
import pandas as pd
'''
uft-8编码:包含全世界所有国家需要用到的字符,英文网站用的较多
gbk编码:包含全部的中文字符
unicode编码:把所有语言统一到一套编码
'''
df=pd.read_csv(r"C:\data\data.csv",encoding='gbk') #pandas默认的编码方式是utf8
#如果python中所要处理的字符串中包含中文,那么最好要搞懂所用字符的编码,是gbk,还是utf-8,否则容易出现乱码,以及语法错误。
#此处如果不写encoding='gbk',会报错((UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte)
1.判定空值所在位置
na=df.isnull()
print(na)
'''
判断每一行是否有空值
'''
print(na.any(axis=1))#any(iterable) 函数用于判断给定的可迭代参数 iterable 是否全部为False,若是则返回 False,如果有一个为 True,则返回 True。
'''
针对某列数据具体判断是否是空值
'''
print(na[['gender']].any(axis=1))
2.提取缺失值所在的行
print(df[na[['gender']].any(axis=1)]) #df[逻辑值]
3.填充缺失值
df1=df.fillna('1')#所有的空值都填1 。df中的内容没有变。na代表空值
3.删除缺失值
'''
删除整行数据
'''
df2=df.dropna() #删除空值数据。df中的内容没有改变。
推荐阅读
-
python,pandas缺失值数据处理
-
Python 7pandas数据处理
-
python pandas 判断表是不是有空的元素 isna()方法 isnull() 方法 区别 删除空值 插值空值 填充空值 处理
-
【数据预处理】Pandas缺失的数据处理
-
Python数据处理工具 ——Pandas(数据的预处理)
-
Python 数据处理库 pandas 入门教程基本操作
-
Python基于pandas的数据处理(一)
-
Python利用pandas计算多个CSV文件数据值的实例
-
python pandas 如何替换某列的一个值
-
python数据处理,pandas包中DataFrame和Series的常用方法整理