语言模型:Trigram-模型的平滑估计

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 该系列将描述一些自然语言处理方面的技术,完整目录请点击这里。 正如我们前面讨论的,三元语言模型有非常多的参数。利用最大似然估计会造成一个很严重的问题,就是很多的值都会变成零,数据将会非常稀疏。即使我们把训练集设置的非常大,但是很多的三元组 c(u, v, w) 或者二元组 c(u, v) 的值还是会很小或者等于
相关文章
相关标签/搜索