天然语言处理简述

天然语言处理的基本流程:翻译

  1)分词排序

  2)命名实体识别,主要有人名,地名,机构名等语法

  3)词性标注,对分词后的词语进行语义标注命名

  4)句法分析,主要是要构建语法树,标注单词,短语,句子的语法问答

  5)语义分析,包括两部分:语义消歧,主要是针对多义词在文中的意思;语义角色标注,主要是要标出一个句子中主谓宾状语等。语义角色标注过于依赖句法分析的准确性,不过目前自动句法分析的准确性并非特别高,所以语义角色标注的效果也通常。语言

  6)篇章分析,在一篇文章中段落的顺序、句子的顺序都是很重要的,按照正确的表达序列排序才能构成完整的篇章。在篇章分析中能够划分的结构有篇章-段落-句子-词、篇章-句子-词、篇章-词等。自然语言处理

  上面的六步只不过是天然语言处理中的中间步骤,并非天然语言处理的最终目标系统

应用一:机器翻译文章

应用二:语音翻译

应用三:文本分类与情感分类 

应用四:信息检索与问答系统

应用五:自动文摘与信息抽取

应用六:口语信息处理与人机对话系统

相关文章
相关标签/搜索