spark

#spark到底解决了什么根本性的技术问题? ##产生的技术环境 避免在多种运算场景,多种集群部署 集群计算数据,典型的思想mr,后来最重要的是hadoop,分布式集群,会把编程简化为位置感知、容错、负载均衡,在集群上操作超大数据,这种模式是数据流的方式;hdfs->计算->hdfs tez dag 基于数据流的dag虽然实现任务调度和故障恢复,但是每次操作读写磁盘,如果同样一次操作,如果第二次操
相关文章
相关标签/搜索