在热词中看舆论,摆脱“黑天鹅”效应

在互联网时代,热词往往反应了一段时间内公众普遍关注的事件。因此,热词计算是舆情系统中的核心模块,针对资讯、评论、弹幕等进行热词统计,可以快速对海量资讯提取核心词汇,帮助用户快速研判舆论舆情。然而海量数据的热词计算,对计算的实时性、准确性提出了很大的挑战。   一、技术难点与常规解决方案   ○ 关键词提取,关键词提取好坏直接影响统计效果,如何提取高质量关键词?常规的技术方案,一般是通过计算TF-I
相关文章
相关标签/搜索