与隐马尔科夫模型相同,为了增强模型的能力,我们对推广基本的线性动态系统有着浓厚的兴趣。虽然线性高斯模型的假设会产生高效的推断和学习算法,但是它也暗示了观测变量的边缘概率分布是一个高斯分布,这会产生很大的局限性。线性动态系统的一个简单的推广是使用 高斯混合分布作为初始分布。如果这个混合分布有个分量,那么前向递归方程(13.85)会 产生隐含变量上的个高斯分布的混合分布,因此模型是可以计算的。
对于许多应用来说,高斯发射概率密度是一个很差的近似。如果我们尝试使用个高斯分布的混合分布作为发射概率密度,那么后验概率分布也会是个高斯分布的混合。然而,根据式(13.85),后验概率分布由个高斯分布混合而成,以此类推,由个高斯分布混合而成。因此,分量的数量随着链的长度指数增长,因此模型无法计算。
更一般地,引入与线性高斯(或指数族)分布差距较大的转移模型或者发射模型会产生一个无法计算的推断问题。我们可以进行确定性的近似,例如假设的密度过滤或者期望传播,或 者我们可以使用13.3.4节讨论的采样方法。一个广泛使用的方法是在预测分布的均值附近进行线性化从而进行了高斯近似,这就产生了推广的Kalman滤波(extended Kalman filter)(Zarchan and Musoff, 2005)。
与隐马尔可夫模型相同,我们可以通过扩展图表示的方法来对基本的线性动态系统进行有趣的推广。例如,切换状态空间模型(switching state space model)(Ghahramani and Hinton,1998)可以被看成隐马尔科夫模型与一组线性动态系统的的组合。模型有多个由连续线性高斯潜在变量组成的马尔科夫链,每一个都类似于之前讨论的线性动态系统的潜在链。模型中还包含了一个在隐马尔科夫模型中使用的离散变量形式的马尔科夫链。在每个时刻的输出按照下面的方式确定:随机选择一个一个连续潜在链,使用离散潜在变量作为一个开关,然后从对应的条件输出分布发射一个观测。这个模型中精确的推断是无法进行的,但是变分方法会产生出一个高效的推断方法,涉及到沿着每个连续的和离散的马尔科夫链独立进行的前向和后向算法。注意,如果我们考虑离散潜在变量的多个链,然后使用一个作为开关,从剩余的链中选择,那么我们得到了一个只有离散潜在变量的类似的模型,被称为切换隐马尔科夫模型(switching hidden Markov model)。