以前在天然语言处理技术系列的第一篇NER实战的结语中介绍过:序列标注(分词,NER),文本分类(情感分析),句子关系判断(语意类似判断),句子生成(机器翻译)是NLP领域的四大任务,以后我又陆续简单介绍了情感分析实战,和Seq2Seq生成对联。今天咱们来到这个系列的终章篇——语义类似判断。语义类似判断就是判断两个句子是否具备相同的语义,其应用场景多用于问答系统:算法
- 判断两个问句是否具备相同的语义。
- 判断问题和检索出的答案是否匹配。
固然也能够用于其余场景好比判断两幅图片是不是同样——人脸识别,因此从广义上来讲,就是语义相识判断就是判断两个东西是否具备某种类似度的任务。spa
语义类似判断任务简介
语义类似能够转化为一个分类问题。给模型输入两个句子,而后但愿模型判断出两个句子语义是否类似。具体输入输出细节以下:
输入:
翻译
- 1.为什么我没法申请开通花呗信用卡收款
- 2.支付宝开通讯用卡花呗收款不符合条件怎么回事
输出:1
若是输出0表示不类似,输出1表示类似。
图片
语义类似判断算法简介
语义类似仍是NLP中的老问题,如何将句子映射到到向量空间中同时保持语义,而后咱们就能够经过各类距离去衡量句子的类似程度。支付宝
- 上古时期的方式是经过bag of words,tf-idf这种词袋模型去映射句子。
- 以后出现了word2vector技术,咱们就能够将一句话中每一个词的的词向量求平均来