个人工程实践选题是文本情感分析,即意见挖掘。简单而言,是对带有情感色彩的主观性文本进行分析、处理、概括和推理的过程。例如如今互联网上每时每刻都在产生大量的评论,这些评论信息表达了人们的各类情感色彩和情感倾向性,如喜、怒、哀、乐和批评等,基于情感分析,潜在的用户就能够经过浏览这些主观色彩的评论来了解大众舆论对于莫一事件或产品的见解。因此说文本情感分析的研究价值很大,所以文本情感分析也成为了NLP中很热门的研究领域。网络
经过调研了解到百度AI开放平台上就有文本情感分析的功能演示,其大概的功能就是你输入一段评论可以得出评论的情感色彩是正向情感仍是负向情感,以及相应情感色彩的情感倾向程度。效果大概以下:机器学习
目前国内外在文本情感分析的应用上尚未获得大量的普及,可是其效果都大体同样,由于情感分析只是一种对文本进行分析处理的技术,本文主要在文本情感分析的不一样应用领域上进行研究和对比。学习
情感分析在互联网商品评论中的应用。这是随着电子商务蓬勃发展而兴起的一个研究领域,它具备很是普遍的应用前景与巨大的商业价值。针对商品评论的情感分析每每须要从更细的粒度来进行分析,而不是以文本为单位,由于对于商品使用者来讲,每每是针对产品的某一些特征或主题进行评论,而不是整个产品。可是要将情感分析技术运用到具体的商业应用,还面临这较大的困难。例如如今愈来愈多的厂商为了提升商品的销量,每每会在商品评论中添加不少的虚假评论,经过“刷单”的方式吸引潜在的消费者,所以这严重减低了情感分析的准确率。测试
情感分析在微博中的应用。因为微博的可移动性、内容的共享性、简洁性和实时性使得微博已经成为了大多数网民平常生活中不可缺乏的交流互动的社交网络媒体,对微博进行情感分析能够了解到用户对某一事件或决策的见解。与对商品评论进行情感分析的方式不一样,微博的情感分析更注重的是情感分类,即将文本内容所表达的情感倾向分为负向、中性和正向。微博的情感分析也面临着不少困难,因为中国人口众多,微博的用户数量也很庞大,用户天天发的微博内容能够构成一个庞大的语料库,可是因为中文分词的复杂性,须要将文本进行向量化,因此对语料库的标注是一个极其耗时耗力的事情,一样也存在很大错误率。3d
情感分析在股票预测中的应用。对于金融这个领域,互联网已经成为投资者获取各类股市投资信息的主要渠道,于此同时,愈来愈多的投资者经过互联网来搜索相关金融信息,同时发表本身对于金融市场的观点,就企业投资意向、市场走势等问题进行交流,经过研究发现一我的的行为和情绪有很大联系,因此能够经过情感色彩来对股票进行预测。这类研究主要应用文本挖掘技术来识别在线评论的极性,或是经过机器学习的技术提取文本数据特征,再和相关的股市表现数据进行测试训练来进行预测。主要从大盘、板块、行业和个股四个层面来分析研究股评情感指数与股市表现之间的关系。该领域的难点有,相关股票金融信息的挖掘须要结合专业的金融背景知识来分析,在金融环境下有效识别评论情感倾向存在必定的难度。blog