word2vector 2

接着上一篇讲。 中文解析链接!!!很清楚!!! 我们发现构建一个这样的三层网络需要太多的features 了,这样会使计算大大增加。所以我们必须做一些修改, 1.在模型中将常用单词对或短语视为单个“单词”。比如:“我擦”的意思和 “我” & “擦”是不一样的。在此不再详细解释 2.对频繁的词进行子采样以减少训练实例的数量。 3.用“负采样”的技术修改优化目标,这会使每个训练样本只更新一小部分模型的
相关文章
相关标签/搜索