如何处理DataFrame丢失数据
程序员文章站
2024-01-24 15:40:28
...
如何处理DataFrame丢失数据
# 处理丢失数据
dates = pd.date_range('20130101', periods=6)
df = pd.DataFrame(np.arange(24).reshape((6, 4)), index=dates, columns=['A', 'B', 'C', 'D'])
df.iloc[0, 1] = np.nan
df.iloc[1, 2] = np.nan
``
# 如果想直接去掉有 NaN 的行或列, 可以使用 dropna
df_drop = df.dropna(
axis=0, # 0: 对行进行操作; 1: 对列进行操作
how='any' # 'any': 只要存在 NaN 就 drop 掉; 'all': 必须全部是 NaN 才 drop
)
print(df_drop)
print(df.fillna(value=0)) # 如果是将 NaN 的值用其他值代替, 比如代替成 0:
print(pd.isnull(df))