numpy 对矩阵中Nan的处理:采用平均值的方法
程序员文章站
2022-07-04 22:47:54
尽管我们可以将所有的nan替换成0,但是由于并不知道这些值的意义,所以这样做是个下策。如果它们是开氏温度,那么将它们置成0这种处理策略就太差劲了。
下面我们用平均值来代替...
尽管我们可以将所有的nan替换成0,但是由于并不知道这些值的意义,所以这样做是个下策。如果它们是开氏温度,那么将它们置成0这种处理策略就太差劲了。
下面我们用平均值来代替缺失值,平均值根据那些非nan得到。
from numpy import * datmat = mat([[1,2,3],[4,nan,6]]) numfeat = shape(datmat)[1] for i in range(numfeat): meanval = mean(datmat[nonzero(~isnan(datmat[:,i].a))[0],i]) #values that are not nan (a number) datmat[nonzero(isnan(datmat[:,i].a))[0],i] = meanval #set nan values to mean
以上这篇numpy 对矩阵中nan的处理:采用平均值的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
上一篇: 对象的比较