英文分词处理

纯粹的文本我们也叫作语料 文本数据特点: 非结构化 海量数据 高维稀疏性 语义/情感 一句话里面有多少个词就有多少个维度 文本的分析就是他所包含的语义 往往都存在一个倾向性 自然语言处理-NLP 机器翻译 自动摘要(当我们在做舆情分析的时候,找到一个文章,能不能自动生成一个文本的摘要) 文本分类(根据文本的关键词进行文本的分类,在自然语言中有一个实体命名,时间,地点等) 信息检索(通过词相互之间的
相关文章
相关标签/搜索