Spark编程基础-课堂笔记(一)

本文主要对厦门大学《spark》编程基础课程知识点进行记录 大数据4V特性 大量化 Volume 多样化 Variety:数据不只限于结构化数据,目前非结构化数据居多 处理速度快 Velocity:有实时响应的需求 价值密度低 Value 大数据关键技术 数据采集:爬虫工具/ETL工具(抽取 转换 加载) 数据存储与管理:分布式文件系统/分布式数据库/NoSQL数据库 数据处理与分析:分布式架构(
相关文章
相关标签/搜索