数据归一化
程序员文章站
2024-03-25 09:18:10
...
version:python 3.6
环境:anaconda/JupyterLab 0.27.0
操作系统:Windows 10
数据处理时经常用到数据归一化和标准化,但是一个数据集,不同字段之间的量纲和数据大小分布不一致。所以需要按列归一化,而不是直接对所有数据归一化。
下面是我写的函数,可以直接调用:
def minmax_scale(data):
for col in feature_list:
MAX = data[col].max()
MIN = data[col].min()
MEAN = data[col].mean()
if MAX > MIN:
data[col] = data[col].apply(lambda x: (float(x) - float(MIN)) / (float(MAX) - float(MIN))).fillna(MEAN)
else:
data[col] = (data[col] / float(MAX)).fillna(MEAN)
return data
上一篇: Bootstrap起步
推荐阅读
-
python 对数据进行归一化
-
【spark学习】 博客分类: 大数据学习 大数据spark
-
数据归一化
-
R语言 博客分类: 大数据学习 R语言
-
【spark学习】 博客分类: 大数据学习 大数据spark
-
karto探秘之open_karto 第一章 --- 数据结构
-
【hive学习】 博客分类: 大数据学习 hive
-
ORACLE中VARCHAR2类型的字段长度是按照byte来定义的-一个容易被忽略的问题 博客分类: 数据库 Oracle字符字节varchar2char
-
【java】学习---爬虫 博客分类: 爬虫大数据学习java学习 java爬虫
-
过去的一个关于数据库设计的讨论,觉得有些价值,自己收藏起来 博客分类: PowerDesigner 数据结构Hibernate多线程电子商务单元测试