让我们先考虑关于来最大化。首先定义特征方程:

根据式(3.81)得到的特征值。现在考虑式(3.86)中涉及的项关于的导数。得到:

因此式(3.86)关于的驻点满足

乘以,整理,可得

由于关于的求和项有个,因此可以写成:

稍后讨论的解释。根据方程(3.90),得到使得边缘似然函数最大化的满足:

注意,这是的一个隐式解,不仅仅因为相关,还因为后验分布众数本身也与的选择有关。因此我们使用迭代的方法求解。首先我们选择一个的初始值,再把这个初始值代入式(3.53)求得,利用式(3.91)计算得到,然后这些值再被代入式(3.92)来重新估计的值。 不断执行这个过程直至收敛。注意,由于矩阵是固定的,因此我们只需要在最开始的时候计算一次特征值,然后接下来只需乘以就可以得到的值。

需要强调的是,的值是完全通过训练集的数据来确定的。最大似然方法不同,模型的最优的复杂度不需要独立的数据集。

类似地,我们可以关于最大化对数边缘似然函数(3.86)。为了达到这个目的,我们注意到由式(3.87)定义的特征值正比于,即,得到:

因此,边缘似然的驻点满足:

整理可得:

与之前一样,这是的一个隐式解,可以通过迭代的方法解出。首先选择的一个初始值,然后使用这个初始值计算,然后使用式(3.95)重新估计的值,重复直到收敛。如果的值都是由数据确定的,那么他们的值可以在每次更新之后一起重新估计。

results matching ""

    No results matching ""