从KL散度到MLE

MIT的课程 18.650 statistics for applications 在Lecture 4 讲MLE的时候,和通常书本上来就给出MLE公式的方法不一样,这里使用Max variant distance -> KLdivergence ->MLE的方式,初看到这个过程,心里感受仍是比较有意思的,简单记录以下web 假设咱们要估算某个分布P的参数 θ∗ θ ∗ ,记为 θ^ θ ^ ,咱
相关文章
相关标签/搜索