为了引出高斯过程的观点,让我们回到线性回归的例子中,通过对函数的计算,重新推导出预测分布。来给出高斯过程的一个具体的例子。

考虑一个模型,它被定义为由向量的元素给出的个固定基函数的线性组合,即

其中是输入向量,维权向量。现在,考虑上的一个先验概率分布,这个分布是一个各向同性的高斯分布,形式为

它由一个表示分布精度(方差的逆)的超参数控制。对于任意给定的,式(6.49)定义了的一个特定函数。于是,式(6.50)定义的上的概率分布就产生了一个函数上的一个概率分布。在实际应用中,我们希望计算这个函数在某个具体的处的函数值,例如在训练数据点处的函数值。于是我们感兴趣的是函数值的概率分布。我们把函数值的集合记作向量,它的元素为,其中。根据式(6.49)这个向量等于

其中是设计矩阵,元素为。首先,我们注意到由的元素给出的服从高斯分布的变量的线性组合,因此它本身是服从高斯分布。 于是,我们只需要找到它的均值和方差找到的概率分布,就找到的概率分布。根据公式(6.50),均值和方差为

其中是元素为

的Gram矩阵。其中是核函数。

这个模型给我们提供了高斯过程的一个具体的例子。通常来说,高斯过程被定义为函数上的一个概率分布,使得在任意点集处计算的的值的集合联合起来服从高斯分布。在输入向量是二维的情况下,这也可以被称为高斯随机场(Gaussian random field)。更一般地,可以用一种合理的方式为赋予一个联合的概率分布,来确定一个随机过程(stochastic process)

高斯随机过程的一个关键点是个变量上的联合概率分布完全由二阶统计(即均值和协方差)确定。在大部分应用中,我们关于的均值没有任何先验的知识,因此根据对称性,我们令其等于零。这等价于基函数的观点中,令权值的先验概率分布的均值等于0。之后,高斯过程的确定通过给定两个处的函数值的协方差来完成。这个协方差由核函数确定

对于由式(6.49)定义的带有权值先验(6.50)的线性回归模型来说,核函数为(6.54)。

我们也可以直接定义核函数,而不是间接地通过选择基函数。图6.4给出了两个不同的核函数的由高斯过程产生的函数的样本。

图 6-4
图 6.4 左图为“高斯”核的高斯过程的样本,右图为指数核的高斯过程的样本

第一个核函数是式(6.23)定义的高斯核,第二个核函数是定义为

的指数核。它对应于最开始由Uhlenbeck and Ornstein(1993)提出的,用来描述布朗运动的Ornstein-Uhlenbeck过程。

results matching ""

    No results matching ""