对于没有线性高斯分布的动态系统,例如使用非高斯发射概率密度的动态系统,为了得到一个可以计算的推断算法,我们使用采样算法。特别地,我们可以使用11.1.5节讨论的采样-重要性-在采样方法,得到一个顺序的蒙特卡罗算法,被称为粒子滤波。

考虑图13.5中的图模型表示的概率分布,假设我们有观测变量,我们希望从后验概率分布中抽取个样本。使用贝叶斯定理,我们有

其中是从中抽取的一组样本,并且我们使用了条件独立性质,这个性质来自于图13.5所示的图模型。采样权值的定义 为

其中我们在分子和分母中使用了同样的样本。因此后验概率分布由样本集合以及对应的权值表示。注意,权值一定满足以及

由于我们希望找到一个顺序采样的方法,因此我们假设我们在时刻已经得到了一组样本和权值,并且我们顺序地观测到了的值,我们希望找到时刻的权值和样本。我们首先从概率分布中采样。这很容易做到,因为使用贝叶斯定义,我们有

其中我们使用了条件独立性质

这可以通过对图13.5所示的图模型应用d-划分准则的方式得到。式(13.119)的概率分布是一个混合分布,样本可以通过下面的方式得到:根据混合系数指定的概率,选择一个分量, 然后从对应的分布中采样。

总结一下,我们可以将粒子滤波算法的每一步看成由两个阶段组成。在时刻,我们有一个后验概率的样本表示,它根据以及对应的权值表示。这可以看成形如(13.119)的混合表示。为了得到下一个时刻的对应的表示,我们首先从混合分布(13.119)中抽取个样本,然后对于每个样本,我们使用新的观测计算对应的权值。图13.23说明了单一变量的情形。

图 13-22
图 13.22 对于一维潜在空间,粒子滤波操作的图形表示。在时刻,后验概率分布被表示为混合概率分布,用圆圈表示,它的大小正比于权值。之后,一组个样本从这个概率分布中抽取,新的权值使用计算。

粒子滤波或者顺序蒙特卡罗方法在文献中有多个名字,包括自助滤波(bootstrap filter) (Gordon et al., 1993)、最适幸存(survival of the fittest)(kanazawa et al., 1995)以及凝结算法 (condensation algorithm)(Isard and Blake, 1998)。

results matching ""

    No results matching ""