NLP的编辑距离 一文读懂

在NLP任务中经常会碰到比较两个字符串的相似度,比如拼写纠错和指代判断。用户很可能在搜索时输入错别字,比如“微信”输成了“为信”,但是搜索引擎返回的结果纠正为“微信”的搜索结果,如图1-1。另外比如“北京大学校长”和“北大校长”,“北京故宫博物院”和“北京故宫”都是指的同一个人或事物。 上述问题,可以利用两个词或短语的编辑距离大小来解决。 图1-1 搜索词“为信”的百度结果   编辑距离介绍 利用
相关文章
相关标签/搜索