11.1.2节讨论的拒绝采样方法部分依赖于它能够成功确定常数k的一个合适的值。对于许多对概率分布来说,确定一个合适的值是不现实的,因为任意的足够大的值都能够保证产生所求的分布的上界,但是这会产生相当小的接受率。

与拒绝采样的情形相同,采样-重要-再采样(sampling-importance-resampling, SIR)方法也使用采样分布,但是避免了必须确定常数。这个方法有两个阶段。在第一个阶段,个样本中抽取。然后在第二个阶段,权值通过式(11.23)被构建出来。最后,个样本的第二个集合从离散概率分布中抽取,概率由权值给定。

生成的个样本只是近似地服从,但是在极限的情况下,分布变为了正确的分布。为了说明这一点,考虑一元变量的情形,并且注意重新采样的值的累积分布为

其中是示性函数(参数为真时函数值为1,否则为0)。取极限,并且假设概率分布进行了适当的正则化,我们可以将求和替换为积分,权值为原始的采样分布,即

它是的累积分布函数。同样的,我们看到对的标准化是不需要的。

对于的一个有限值,以及一个给定的初始样本集合,重新采样的值只是近似地从所求的概率分布中抽取。与拒绝采样的情形相同,随着样本分布接近所求的分布,近似的效果也会提升。当时,初始样本服从所求的概率分布,权值为,从而重新采样的值也服从所求的分布。

如果我们需要求出关于概率分布的各阶矩,那么可以直接使用原始样本和权值进行计算,因为

results matching ""

    No results matching ""