关于spark-①

spark概念: spark是统一的分布式大数据分析引擎,spark能够适应多种计算场景,spark能够分析数据,但是没有存储。一般线上的spark数据来源(HDFS,hive,kafka,flume,日志文件,关系型数据库,nosql数据库)。spark出口(hdfs,hive,redise,关系型数据库,nosql数据库)。spark一般情况是以集群模式存在,架构:master/slaver(
相关文章
相关标签/搜索