目前为止,在本章中学习的概率分布(除了高斯混合分布)都是一种叫做指数族这一大类分布中的特殊例子(Duda and Hart, 1973; Bernardo and Smith, 1994)。指数族分布的成员拥有很多共同的重要性质,且在某种程度的通用性下讨论这些性质很有启发性。

给定参数上的指数族分布是具有

形式的概率分布的集合。其中可以是标量也可以是向量,可以是连续的也可以是离散的。是分布的自然参数(natural parameters),是关于的某个函数。函数可以解释为是为了保证分布标准化的系数,且满足:

其中,对于离散变量积分就变成求和。

首先,给出一些本章之前讨论的一些分布,然后证明这些分布确实是指数族分布。首先考虑伯努利分布:

把右侧表示成对数的指数形式,得到:

与公式(2.194)对照,得到:

然后就可以解出,其中

这就是logistic sigmoid函数。因此可以把伯努利分布写成式(2.194)的标准形式:

其中使用了可以从式(2.199)中很容易证明的,对比公式(2.194)得到:

接下来,考虑单观测值的多项式分布:

其中。同样的,可以写成式(2.194)的标准形式:

其中,且定义了。同样,对比式(2.194)得到:

注意,因为参数要满足

,所以给定任意个参数剩下的参数就固定了,因此参数不是相互独立的。在某些情况下,去掉这个限制,只用个参数来表示分布会比较方便。可以使用式(2.209)中的关系,用来表示最后的,这样就只剩下个参数了。注意,剩余的参数仍然要满足:

使用式(2.209)的约束,这种表达方式下多项式分布变成:

现在,确定

首先两边对求和,然后重新整理,回带,就可以解出

这被称为softmax函数,或标准化指数(normalized exponential)。在这种表达方式下,多项式分布具有:

这是具有参数向量的指数族的标准形式。其中:

最后,考察高斯分布。对于一元高斯有:

经过一些简单的重排列之后,可以转化为式(2.194)给出的标准指数族分布的形式,其中:

一些证明

2.213

由式2.212可得

那么我们就有
于是

整理可得

带回前式我们就得到

results matching ""

    No results matching ""