Druid原理分析之“批”任务数据流转过程

时间 2021-07-13

标签 Druid 栏目 Java开源繁體版

原文原文链接

本文以HDFS中的数据作为数据源，描述Druid中对批数据的处理流程：向Druid中提交批数据处理请求。Druid中的批处理任务会从HDFS中获取原数据。批任务会根据处理请求生成segment，并将生成的segments存到Deep Storage（HDFS）中。将生成的segment的元数据信息保存到元数据存储DB（如MySQL） Coordinator会定时从元数据存储DB中查新生成的s

>>阅读原文<<