语言模型

关联规则多用于推荐系统,但是目前大部分的推荐都是推荐关联度高的信息。 但是可以反向使用关联规则来帮助我们找出停滞词(无关词) 序列模型的采样 gram模型的缺点: 参数系数,参数空间过大,存储和内存吃不消 没有考虑文本中出现过多的废话词,可以用tf-idf优化 没有考虑久远之前出现的词语对现在的影响,可以用bigram、trigram等词袋模型解决 你知道的越多,你不知道的越多。 有道无术,术尚可
相关文章
相关标签/搜索