###用途
吉布斯采样虽然是种采样方法,但是可以用来做参数估计,具体怎么做呢?一点点往下看吧。
吉布斯采样适用于处理信息不完整的情况。虽然很多应用都建议使用该方法,但是由于它经常带来一定的计算代价,并且也有一些在实践中被证明是替代它的方法被发现。学习吉布斯采样还是可以有利于进一步理解统计推断的思想。
###Part I
先从随机过程开始说。
假定一个马尔科夫随机过程,状态并且转移概率是。
在上述假设中,状态空间是有限的,但是这并不是吉布斯采样的必要条件。假设这个过程是遍历性(ergodic)的,也就是说从任何一个状态到另外的状态都是可能的,即概率大于0。用来表示经过t步之后的状态,表示初始状态。
用来表示这个过程的长期频率(long-run frequencies)。也就是对于大t。 对于大t来说经过t步之后的状态,最有可能是$max_i pi_i$。简单的办法来估计最可能的状态就是从一个随机开始的状态,运行一个很大数目的步骤,追踪这个过程中各个状态出现的频次,用相应的频率去估计。强遍历性确保了这个过程可以从任意一个状态开始。
###Part II
假定是一个随机变量集合;是在X上的概率分布(均大于0)。 下面将把这些变量作为状态变量来做一个特定的马尔科夫过程。定义马尔科夫过程如下: 其中是的值的集合。用$x_{i,t}$表示一个随机变量对应的在t时刻的第i个状态变量。 定义在t时刻的状态如下:
定义转移概率:
其中$Pr(x_i | {x_j:j!=i}$来自联合概率分布Pr(x). |
为了找到最大的后验概率(MAP)值对应 $x_i$,根据$Pr(x)$去运行一个足够大的随机过程,如Part I所述。
这就是吉布斯采样的全部了。尼玛,自己还是云里雾里的
###Part III
###参考文献
http://cs.brown.edu/research/ai/dynamics/tutorial/Documents/GibbsSampling.html