现在,让我们考虑离散特征值。简单起见,我们以二元特征值开始,之后再推广到更一般的离散特征情形。如果有个输入,那么通常,每个类的分布会对应一个大小为的表格,包含个独立变量(由于要满足和的限制)。有时这是关于特征数量指数增长的,因此我们想寻找一个更加严格的表示方法。这里我们做出把特征值看成以为条件相互独立的朴素贝叶斯假设。这样就得到类的条件分布形式:

其中每个类别包含个独立参数。代入式(4.63)得到

这又是一个关于输入值的线性函数。对于个类别的情形,我们可以考虑式(4.57)给出的logistic sigmoid函数来替代。对于有个状态的离散变量也有类似结果。

results matching ""

    No results matching ""