关于CarbonData+Spark SQL的一些应用实践和调优

大数据时代,中大型企业数据的爆发式增加,几乎天天都能产生约 100GB 到 10TB 的数据。而企业数据分系统构建与扩张,致使不一样应用场景下大数据冗余严重。行业亟需一个高效、统一的融合数仓,从海量数据中快速获取有效信息,从而洞察机遇、规避风险。web 在这样的现状下,CarbonData 诞生了,做为首个由中国贡献给Apache社区的顶级开源项目,CarbonData 提供了一种新的融合数据存储
相关文章
相关标签/搜索