现在,考虑最小二乘方法的几何解释比较有指导意义。为了达到这个目的,考虑坐标轴由给出的维空间,是空间中的向量。通过个点估计出的每个基函数也可以表示成相同空间中的一个向量,记作,如图3.2展示。
图 3.2 最小二乘几何解释
注意对应的是的第列,而对应的是的第行。如果基函数的数量小于数据点的数量,那么个向量可以生成维线性子空间。我们定义是维向量,其中第个元素由。由于是向量的任意线性组合,所以它可以在维子空间的任意位置。平方和误差(3.12)等于之间的欧式距离(相差一个因子1/2)。所以的最小二乘解,对应子空间中与最近的的选择。直观地来说,从图3.2得到,我们预期这个解与在子空间上的投影正交。我们看到的解是由给出的,然后可以很容易的证明它就是是正交投影的形式这一事实。
在实际应用中,当接近奇异矩阵时,直接求解标准方程会导致数值计算上的困难。特别地,当两个或更多的基向量共线或接近共线时,参数的结果会相当大。这样的退化在处理真实数据集的时候并不少见。这样的数值计算上的困难可以通过奇异值分解(singular value decomposition)简称SVD的方法来解决(Press et al., 1992; Bishop and Nabney, 2008)。注意,额外的正则项可以确保即使在退化的情况下,矩阵也是非奇异的。