《天然语言处理入门》读书笔记

第一章,新手上路 1.1天然语言与编程语言 词汇量 结构化: 歧义性: 容错性; 易变性 简略性 1.2天然语言处理的层次 文本:语音(语音识别),图像(光学符号识别),和文本。 词法分析: 中文分词(将文本分割为有意义的词语,将字序列分割为次序列), 词性标注(肯定每一个词语的类别和浅层的歧义消除), 命名实体识别(较长的专有名词) 信息抽取:根据单词和词性,抽取一部分有用的信息 文本分类与文本
相关文章
相关标签/搜索