Hive+Druid 实现快速查询；回归分析是机器学习吗；StructuredStreaming 可用于生产环境

时间 2021-07-13

标签 hive druid machine-learning spark spark-streaming 栏目 Hadoop 繁體版

原文原文链接

结合 Apache Hive 和 Druid 实现高速 OLAP 查询 Hadoop 生态中，我们使用 Hive 将 SQL 语句编译为 MapReduce 任务，对海量数据进行操作；Druid 则是一款独立的分布式列式存储系统，通常用于执行面向最终用户的即席查询和实时分析。 Druid 的高速查询主要得益于列式存储和倒排索引，其中倒排索引是和 Hive 的主要区别。数据表中的维度字段越多，查询速

>>阅读原文<<