使用Spark Streaming进行豆瓣用户画像分析

    研一上学期,云计算课程,老师希望我们能掌握基于 Spark、HDFS 和 MongoDB 的本地高效分布式数据处理和存储环境的搭建和技术使用。我们小组选的课题是豆瓣小组和用户数据。其中,我作为组长,负责编写 Spark Streaming 部分和聚类部分的代码。     时间很紧凑,一周内就要自学之前完全不熟悉的大数据处理领域,并且完成案例实现,这对于我来说是个不小的挑战。于是那一周我早起
相关文章
相关标签/搜索