pandas中na_values与keep_default_na

程序员文章站 2023-03-26 20:37:23

我们在使用pandas读取文件时，常会遇到某个字段为NaN。一般情况下，这时因为文件中包含空值导致的，因为pandas默认会将 '-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'N ......

我们在使用pandas读取文件时，常会遇到某个字段为nan。

一般情况下，这时因为文件中包含空值导致的，因为pandas默认会将

'-1.#ind', '1.#qnan', '1.#ind', '-1.#qnan', '#n/a n/a','#n/a', 'n/a', 'na', '#na', 'null', 'nan', '-nan', 'nan', '-nan', ''

判定为缺失值，从而转换为nan。

那么如何避免data frame中出现nan呢，使用keep_default_na参数可以解决。

keep_default_na参数用来控制是否要将被判定的缺失值转换为nan这一过程，默认为true。，当keep_default_na=false时，源文件中出现的什么值，dataframe中就是什么值。

下来再说na_values参数，这个参数用来控制那些值会被判定为缺失值，它接收一个列表或者集合，当列表或者几个中出现的字符串在文件中出现时，它也会被判定为缺失值.

但是，无论此时keep_default_na=true还是false，他都将被改写。

上一篇： python爬虫处理在线预览的pdf文档

下一篇：双向链表实现原理

pandas中na_values与keep_default_na

整理总结 python 中时间日期类数据处理与类型转换(含 pandas)