目前为止,在本章中学习的概率分布(除了高斯混合分布)都是一种叫做指数族这一大类分布中的特殊例子(Duda and Hart, 1973; Bernardo and Smith, 1994)。指数族分布的成员拥有很多共同的重要性质,且在某种程度的通用性下讨论这些性质很有启发性。
给定参数的上的指数族分布是具有
形式的概率分布的集合。其中可以是标量也可以是向量,可以是连续的也可以是离散的。是分布的自然参数(natural parameters),是关于的某个函数。函数可以解释为是为了保证分布标准化的系数,且满足:
其中,对于离散变量积分就变成求和。
首先,给出一些本章之前讨论的一些分布,然后证明这些分布确实是指数族分布。首先考虑伯努利分布:
把右侧表示成对数的指数形式,得到:
与公式(2.194)对照,得到:
然后就可以解出,其中
这就是logistic sigmoid函数。因此可以把伯努利分布写成式(2.194)的标准形式:
其中使用了可以从式(2.199)中很容易证明的,对比公式(2.194)得到:
接下来,考虑单观测值的多项式分布:
其中。同样的,可以写成式(2.194)的标准形式:
其中,且定义了。同样,对比式(2.194)得到:
注意,因为参数要满足
,所以给定任意个参数剩下的参数就固定了,因此参数不是相互独立的。在某些情况下,去掉这个限制,只用个参数来表示分布会比较方便。可以使用式(2.209)中的关系,用来表示最后的,这样就只剩下个参数了。注意,剩余的参数仍然要满足:
使用式(2.209)的约束,这种表达方式下多项式分布变成:
现在,确定
首先两边对求和,然后重新整理,回带,就可以解出:
这被称为softmax函数,或标准化指数(normalized exponential)。在这种表达方式下,多项式分布具有:
这是具有参数向量的指数族的标准形式。其中:
最后,考察高斯分布。对于一元高斯有:
经过一些简单的重排列之后,可以转化为式(2.194)给出的标准指数族分布的形式,其中:
一些证明
2.213
由式2.212可得
令那么我们就有
于是
整理可得
带回前式我们就得到