一次设计演进之旅 | 张逸

需求背景: 我们需要实现对存储在HDFS中的Parquet文件执行数据查询,并通过REST API暴露给前端以供调用。由于查询的结果可能数量较大,要求API接口能够提供分页查询。在第一阶段,需要支持的报表有5张,需要查询的数据表与字段存在一定差异,查询条件也有一定差异。 每个报表的查询都牵涉到多张表的Join。每张表都被创建为数据集,对应为一个Parquet文件。Parquet文件夹名就是数据集名
相关文章
相关标签/搜索