欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

pandas中na_values与keep_default_na

程序员文章站 2022-05-29 08:15:10
我们在使用pandas读取文件时,常会遇到某个字段为NaN。 一般情况下,这时因为文件中包含空值导致的,因为pandas默认会将 '-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'N ......

我们在使用pandas读取文件时,常会遇到某个字段为nan。

一般情况下,这时因为文件中包含空值导致的,因为pandas默认会将 

'-1.#ind', '1.#qnan', '1.#ind', '-1.#qnan', '#n/a n/a','#n/a', 'n/a', 'na', '#na', 'null', 'nan', '-nan', 'nan', '-nan', ''
判定为缺失值,从而转换为nan。
那么如何避免data frame中出现nan呢,使用keep_default_na参数可以解决。
keep_default_na参数用来控制是否要将被判定的缺失值转换为nan这一过程,默认为true。,当keep_default_na=false时,源文件中出现的什么值,dataframe中就是什么值。
 
 
下来再说na_values参数, 这个参数用来控制那些值会被判定为缺失值,它接收一个列表或者集合,当列表或者几个中出现的字符串在文件中出现时,它也会被判定为缺失值.
但是,无论此时keep_default_na=true还是false,他都将被改写。
pandas中na_values与keep_default_na