Druid原理分析之“批”任务数据流转过程

本文以HDFS中的数据作为数据源,描述Druid中对批数据的处理流程: 向Druid中提交批数据处理请求。Druid中的批处理任务会从HDFS中获取原数据。 批任务会根据处理请求生成segment,并将生成的segments存到Deep Storage(HDFS)中。 将生成的segment的元数据信息保存到元数据存储DB(如MySQL) Coordinator会定时从元数据存储DB中查新生成的s
相关文章
相关标签/搜索