欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

如何处理DataFrame丢失数据

程序员文章站 2024-01-24 15:40:28
...

如何处理DataFrame丢失数据

# 处理丢失数据                                                                                    
dates = pd.date_range('20130101', periods=6)                                                
df = pd.DataFrame(np.arange(24).reshape((6, 4)), index=dates, columns=['A', 'B', 'C', 'D']) 
                                                                                            
df.iloc[0, 1] = np.nan                                                                      
df.iloc[1, 2] = np.nan                                                                      
``
# 如果想直接去掉有 NaN 的行或列, 可以使用 dropna                                        
df_drop = df.dropna(                                                    
    axis=0,  # 0: 对行进行操作; 1: 对列进行操作                                     
    how='any'  # 'any': 只要存在 NaN 就 drop 掉; 'all': 必须全部是 NaN 才 drop      
)                                                                       
print(df_drop)                                                          
print(df.fillna(value=0))  # 如果是将 NaN 的值用其他值代替, 比如代替成 0:                
print(pd.isnull(df))        

结果图片

如何处理DataFrame丢失数据
如何处理DataFrame丢失数据