数据预处理

机器学习的归一化、中心化、标准化的理解

Get Started. It's Free
or sign up with your email address
Rocket clouds
数据预处理 by Mind Map: 数据预处理

1. 归一化

1.1. (0,1)之间的小数

1.2. 有量纲表达式变成无量纲表达式

1.3. 归一化的表达式

1.3.1. 线性

1.3.1.1. x' = (x - X_min) / (X_max - X_min)

1.3.1.2. 平均归一化

1.3.1.2.1. x' = (x - μ) / (MaxValue - MinValue)

1.3.2. 非线性

1.3.2.1. 对数函数转换:y = log10(x)

1.3.2.2. 反余切函数转换:y = atan(x) * 2 / π

1.3.2.3. 数据很大的,用log、指数,正切等

1.4. 使用场景

1.4.1. 对输出结果范围有要求

1.4.2. 数据较为稳定,不存在极端的最大最小值

2. 中心化

2.1. 均值为0

2.2. 标准差无要求

2.3. 使用场景

2.3.1. 数据存在异常值和较多噪音

3. 标准化

3.1. 均值为0

3.2. 标准差为1

3.3. 使用场景

3.3.1. 数据存在异常值和较多噪音