本文将带领你们使用 Apache Spark 和 Kafka 收集、分析和报告网站访问者数据html
点击流分析是收集、分析和报告用户访问了哪些网页的过程,能够提供有关网站使用特征的有用信息。测试
点击流分析的一些流行用例包括:网站
在本 Code Pattern 中,咱们将演示如何检测 Wikipedia 上的实时热门主题。要执行此任务,将会使用 Apache Kafka 做为消息队列,使用 Apache Spark 结构化流引擎来执行分析。这种组合因其实用性、高吞吐量和低延迟特征而闻名。spa
完成本 Code Pattern 后,您将掌握如何:.net
相关演示视频视频
http://v.youku.com/v_show/id_XMzUwODg1NzE4OA==.htmlhtm
更多内容点击进入ip