60TB 数据量的做业从 Hive 迁移到 Spark 在 Facebook 的实践

时间 2020-05-15

标签 60tb 数据 hive 迁移 spark 实践栏目 Hadoop 繁體版

原文原文链接

Facebook 常用分析来进行数据驱动的决策。在过去的几年里，用户和产品都获得了增加，使得咱们分析引擎中单个查询的数据量达到了数十TB。咱们的一些批处理分析都是基于 Hive 平台（Apache Hive 是 Facebook 在2009年贡献给社区的）和 Corona（ Facebook 内部的 MapReduce 实现）进行的。Facebook 还针对包括 Hive 在内的多个内部数据存储，

>>阅读原文<<