问题
在单变量线性回归的基础上,将特征变量个数扩展到n个
思路
基本思路不变,假设函数推广为
矩阵形式:
代价函数
其中:
梯度下降法
正规方程法
优化
特征缩放 (Feature Scaling)
不同特征的数值范围可能差异很大,需要标准化:
标准化 (Standardization):
归一化 (Normalization):
学习率选择
- 太小:收敛慢
- 太大:可能不收敛或发散
- 常用值:0.3, 0.1, 0.03, 0.01, 0.003, 0.001
梯度下降 vs 正规方程
梯度下降 | 正规方程 |
---|---|
需要选择α | 无需选择α |
需要迭代 | 一步求解 |
适用大数据 | n < 10000时适用 |
复杂度O(kn²) | 复杂度O(n³) |