LaBSE: 支持 109 种语言的多语言 BERT 嵌入向量模型

文 / 软件工程师 Yinfei Yang 和 Fangxiaoyu Feng,Google Research 多语言嵌入向量模型是一种功能强大的工具,可以将不同语言的文本编码到共享的嵌入向量空间,可应用于下游一系列任务,例如文本分类、聚类等,同时还能够利用语义信息理解语言。现有生成此类嵌入向量的方法(如 LASER 或 m~USE)依赖于并行数据,将句子从一种语言直接映射到另一种语言,促进句子嵌
相关文章
相关标签/搜索