最近参与某新自定义查询系统开发,系统是锋哥设计的,核心代码也是锋哥写的。做为一个搬砖者自下而上的分析学习一下大神的系统设计。文中的谈到架构设计内容是根据对代码理解从新整理出来的,不表明系统的实际架构和实现。同时因为业务和技术的复杂性及其余缘由,不对实现细节做说明。前端
在该系统以前已经有两个自定义查询系统,一个为竞争对手的CS系统,一个为我司开发的BS系统。两个系统均用了MS SQLSERVER为数据存储和查询引擎,实现的业务功能不少,同时也有比较严重的性能问题。新系统的主要使命是用新技术提升自定义查询性能,改善可用性,同时对飙竞争对手的系统。所以也有不少设计上不合理但必须的功能。数据库
系统中用到了一些新技术,这些新技术或者非主流的技术是该系统实现的基石,这里作一个简单介绍。后端
系统的主要目的是将若干业务系统的数据信息,清洗转换汇聚到ES中,利用ES在查询方面的性能优点,来实现自定义查询。系统逻辑上大概能够分为如下几个模块:缓存
什么是数据模型?
数据模型出现的本质缘由是RDBMS与ES的数据建模方式不一样,须要一套对应规则将各业务系统的数据库表及数据对应到ES中。本系统中数据模型是什么呢?不是代码,是四张核心的excel。这四张excel是本系统的灵魂和精华所在,10万行代码本质上就是围绕这四张excel编写的,同时excel中的数据固化到元数据库中。架构
数据模型解决了什么问题?app
经过如下几个主要的步骤实现数据从业务库到ES中的同步:前后端分离
系统经过如下几个步骤实现数据的装载和转换:性能
什么是查询引擎?
查询引擎主要将前台页面选择的条件和展现字段、排序方式、分页方式、数据合并方式等在后台转换成ES的DSL查询语言并查询出结果。是系统最重要的模块,同时也是代码逻辑最复杂的模块。学习
查询条件的组合方式
从组合方式上来讲,查询条件有与、或、非、异或、全或几种组合,分别对应着DSL的 must、should、must_not 和其组合。ui
值的比较方式
从值的比较方式上来讲,主要有精确匹配、范围匹配、前缀匹配、模糊匹配等,分别对应着DSL的term、terms、range、prefix、wildcard等
ES的数据建模方式
从ES的数据建模方式来看,查询主要能够分为嵌套查询、父子查询、子父查询、父子+嵌套查询等
系统主要以流水线得思想将一个复杂的查询拼装,分配给各组件完成,并统一组装,主要有嵌套查询流水线、父子查询流水线、子父查询流水线等
模板引擎主要将大量重复劳动或者须要灵活变更或者特殊对应关系的代码用模板生成,主要生成前端Html、pojo类,mapper映射和其余元数据磁盘缓存等。
首先,优势:
其次,缺点: