问题

在单变量线性回归的基础上,将特征变量个数扩展到n个

思路

基本思路不变,假设函数推广为

矩阵形式:

代价函数

其中:

梯度下降法

正规方程法

优化

特征缩放 (Feature Scaling)

不同特征的数值范围可能差异很大,需要标准化:

标准化 (Standardization)

归一化 (Normalization)

学习率选择

  • 太小:收敛慢
  • 太大:可能不收敛或发散
  • 常用值:0.3, 0.1, 0.03, 0.01, 0.003, 0.001

梯度下降 vs 正规方程

梯度下降正规方程
需要选择α无需选择α
需要迭代一步求解
适用大数据n < 10000时适用
复杂度O(kn²)复杂度O(n³)