回忆一下,在4.4节中,拉普拉斯近似是先寻找后验概率分布的众数,然后拟合一个以众数为中心的高斯来得到的。这需要计算对数后验的二阶导数,这等价于寻找Hessian矩阵。
因为我们在寻找后验分布的高斯表达方式,所以选择高斯先验是很自然的,把它写成一般形式
p(w)=N(w|m0,S0)
其中m0,S0是固定的超参数。w的后验分布由
p(w|t)∝p(w)p(t|w)
其中t=(t1,...,tN)T。对两边取对数,并代入先验分布(4.140),对于使用式(4.89)的似然函数得到
lnp(w|t)=−12(w−m0)TS−10(w−m0)+N∑n=1{tnlnyn+(1−tn)ln(1−yn)}+const
其中yn=σ(wTϕn)。为了得到后验分布的高斯近似,首先最大化后验分布来得到定义了高斯均值的MAP(最大化后验)解wMAP。协方差由似然函数的对数的负的二阶导数的矩阵的逆给出:
Sn=−∇∇lnp(w|t)=S−10+N∑n=1yn(1−yn)ϕnϕTn
那么后验分布的高斯近似具有
q(w)=N(w|wMAP,SN)
的形式。
获得后验分布的高斯分布后,剩下的任务就是关于这个概率分布求积分来进行预测。