Spark经典面试题(二)

1.什么是spark? spark是基于内存计算的通用大数据并行计算框架,是一个快速、通用可扩展的大数据分析引擎。它给出了大一统的软件开发栈,适用于不一样场合的分布式场景,如批处理、迭代算法、交互式查询、流处理、机器学习和图计算。 2.Spark生态系统? SparkCore:spark的核心计算 主要Rdd SparkSQLa:提供了类sql方式操做结构化半结构化数据。对历史数据进行交互式查询。
相关文章
相关标签/搜索