接触NLP也有好长一段时间了,可是对NLP限于知道,可是对总体没有一个很好的认识。特整理了一下思绪,总结记录下:网络
1、NLP的定义机器学习
仍是按照常规的逻辑来看下定义:NLP(Natural Languange Processing,天然语言处理),方法是应用计算机来处理,理解和应用人类语言,目的是达到人机之间进行交流。学习
分红天然语言理解和天然语言生成两部分。引用一个表来归纳下:网站

2、NLP的应用翻译
- 机器翻译:将一种语言翻译成另一种语言,例如:百度翻译
- 情感分析:挖掘人们的观点,情绪对产品、服务等的态度,来评价服务等。起源博客等社交网络。
- 智能问答:机器人回答输入的问题,一些网站的智能问答。
- 文摘生成:机器准确概括,总结并产生文本摘要。
- 文本分类:采集各类文章,进行主题分析,从而进行自动分类。例如垃圾邮件等。
- 舆论分析:经过舆论的内容,半段舆论的导向。分析传播路径以及发展规律,对很差的舆论进行有效控制。
- 知识图谱:把知识点经过相互之间的连理链接起来的网络图。
3、NLP知识构成blog
天然语言处理做为一门比较热的行业,须要语言学、统计学、机器学习、深度学习及天然语言相关理论知识。深度学习
- 句法语义分析:针对目标句子进行分词,词性标注,命名实体识别,句法分析,语义角色识别和多一次消歧等。
- 关键词提取:提取目标文本中的主要信息。主要明确,谁,什么时间,什么缘由,干了什么事,有啥结果。主要涉及实体识别,时间抽取,因果关系等。
- 文本挖掘:对文本的聚类,分类,信息抽取,摘要,情感分析及对挖掘信息和知识的可视化化。
- 机器翻译:包含文本翻译,语音翻译,手写翻译,图形翻译等。
- 信息检索:信息进行分类归档。
- 问答系统:对语言表达问题。
- 对话系统:经过回合对话,跟用户进行聊天,回答,完成任务。