LASER得到句子向量,计算句子相似度

** 1 LASER 给指定文件计算句子向量 ** ./embed.sh raw.txt zh zh_embeddings.raw raw.txt:未经处理的文件 zh_embeddings.raw:句子向量 假设raw.txt是中文。raw.txt是未分词的数据,未经tokenizer.perl处理的数据,处理过程中用jieba进行分词,并进行bpe切分,之后再计算得到zh_embeddings
相关文章
相关标签/搜索