首页 / 科技数码 / 正文

参数估计方法(MLE,MAP,贝叶斯估计

以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后利用观察到的语料数据对模型参数做估计。有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。本文主要介绍文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。

1. 最大似然估计MLE。首先回顾一下贝叶斯公式

2. 最大后验估计MAP。最大后验估计与最大似然估计相似,不同点在于估计 的函数中允许加入一个先验 ,也就是说此时不是要求似然函数最大,而是要求由贝叶斯公式计算出的整个后验概率最大,即

3 贝叶斯估计。贝叶斯估计是在MAP上做进一步拓展,此时不直接估计参数的值,而是允许参数服从一定概率分布。回顾一下贝叶斯公式

如有侵权请及时联系我们处理,转载请注明出处来自