使用CNN+ Auto-Encoder 实现无监督Sentence Embedding (代码基于Tensorflow)

前言 这篇文章会利用到上一篇: 基于Spark /Tensorflow使用CNN处理NLP的尝试的数据预处理部分,也就是如何将任意一段长度的话表征为一个2维数组。git 本文完整的代码在这: autoencoder-sentence-similarity.pygithub 基本思路是,经过编码解码网络(有点相似微软以前提出的对偶学习),先对句子进行编码,而后进行解码,解码后的语句要和原来的句子尽量
相关文章
相关标签/搜索