SparkES 多维分析引擎设计

设计动机 ElasticSearch 毫秒级的查询响应时间仍是很惊艳的。其优势有:编程 优秀的全文检索能力 高效的列式存储与查询能力 数据分布式存储(Shard 分片) 其列式存储能够有效的支持高效的聚合类查询,譬如groupBy等操做,分布式存储则提高了处理的数据规模。后端 相应的也存在一些缺点:数据结构 缺少优秀的SQL支持 缺少水平扩展的Reduce(Merge)能力,现阶段的实现局限在单机
相关文章
相关标签/搜索