pandas中na_values与keep_default_na
程序员文章站
2023-03-26 20:37:23
我们在使用pandas读取文件时,常会遇到某个字段为NaN。 一般情况下,这时因为文件中包含空值导致的,因为pandas默认会将 '-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'N ......
我们在使用pandas读取文件时,常会遇到某个字段为nan。
一般情况下,这时因为文件中包含空值导致的,因为pandas默认会将
'-1.#ind', '1.#qnan', '1.#ind', '-1.#qnan', '#n/a n/a','#n/a', 'n/a', 'na', '#na', 'null', 'nan', '-nan', 'nan', '-nan', ''
判定为缺失值,从而转换为nan。那么如何避免data frame中出现nan呢,使用keep_default_na参数可以解决。
keep_default_na参数用来控制是否要将被判定的缺失值转换为nan这一过程,默认为true。,当keep_default_na=false时,源文件中出现的什么值,dataframe中就是什么值。
下来再说na_values参数, 这个参数用来控制那些值会被判定为缺失值,它接收一个列表或者集合,当列表或者几个中出现的字符串在文件中出现时,它也会被判定为缺失值.
但是,无论此时keep_default_na=true还是false,他都将被改写。
上一篇: python爬虫处理在线预览的pdf文档
下一篇: 双向链表实现原理
推荐阅读
-
整理总结 python 中时间日期类数据处理与类型转换(含 pandas)
-
pandas中na_values与keep_default_na
-
整理总结 python 中时间日期类数据处理与类型转换(含 pandas)
-
Pandas中loc,iloc与直接切片的区别
-
pandas中na_values与keep_default_na
-
【python数据分析(18)】Pandas中时间序列处理(4)pd.to_period()与pd.to_timestamp()数据之间转换以及时间序列索引及切片
-
python中pandas.DataFrame(创建、索引、增添与删除)的简单操作方法介绍
-
Pandas中loc,iloc与直接切片的区别
-
关于python中pandas.DataFrame对行与列求和及添加新行与列示例代码
-
python中pandas.DataFrame(创建、索引、增添与删除)的简单操作方法介绍