现在我们考虑把Fisher判别式推广到个类别的情况,并假设输入空间的维数大于类别的数量。下面,我们引入个线性“特征”。这些特征值可以很方便的组合成向量的形式。同样的,权向量可以看成矩阵的列,即

再次提醒,我们没有把任何偏置参数包含在的定义中。把类内部协方差矩阵(4.28)推广到个分类的情形,得到

其中

是类的模式数量。为了找到类间协方差矩阵的推广,我是使用Duda and Hart (1973)方法,首先考虑整体协方差矩阵:

其中是整个数据集的均值

是数据的总数。整体协方差矩阵可以分解成式(4.40)(4.41)给出的类间协方差矩阵加上一个类间协方差矩阵

其中

这些协方差矩阵是定义在原来的空间中的。现在可以定义投影的矩阵中的类似矩阵

其中

同样的,我们想构造一个当类间协方差较大,且类内协方差较小时,值比较大的标量。这样的判别准则有很多选择(Fukunaga, 1990)。其中一个例子是

这个判别准则可以写成投影矩阵的显式函数

最大化这个判别准则虽然有点繁琐,但还是很直接的,详细的推导可以参考Fukunaga (1990)。权值由的对应个最大的特征值的特征向量确定。

所有的这些判别准则都有一个很重要的结果。首先,我们注意式(4.46)中是由个两个向量的外积得到的秩为1的矩阵的和组成,

此外,由于式(4.44)给出的限制条件,这些矩阵中只有个是相互独立的,所以的秩最大等于,因此最多有个非零特征值。这表明,向由的特征值所生成的维子空间上的投影不改变的值,这意味这我们不可能找到多于个线性“特征”(Fukunaga, 1990)。

results matching ""

    No results matching ""