Apache Spark

Apache Spark™是用于大规模数据处理的统一分析引擎 一、架构及生态 架构示意图如下: 注:包括SQL和DataFrames,MLlib机器学习, GraphX和Streaming。sparkcore可以用来做离线处理,sparksql可以用来交互式查询,sparkstreaming用来进行实时处理,MLib用来进行机器学习,GraphX进行图计算。您可以在同一应用程序中无缝组合这些库。
相关文章
相关标签/搜索