60TB 数据量的做业从 Hive 迁移到 Spark 在 Facebook 的实践

Facebook 常用分析来进行数据驱动的决策。在过去的几年里,用户和产品都获得了增加,使得咱们分析引擎中单个查询的数据量达到了数十TB。咱们的一些批处理分析都是基于 Hive 平台(Apache Hive 是 Facebook 在2009年贡献给社区的)和 Corona( Facebook 内部的 MapReduce 实现)进行的。Facebook 还针对包括 Hive 在内的多个内部数据存储,
相关文章
相关标签/搜索