要在 Java 代码中实现相似 SQL 中的 GroupBy 分组聚合运算,是比较繁琐的,一般先要声明数据结构(Java 实体类),而后用 Java 集合进行循环遍历,最后根据分组条件添加到某个子集合中。Java 8 有了 Lambda(stream)代码简洁了许多,分组后每每还要跟着聚合操做,仍然须要单写聚合函数 sum(),count(*),topN()等。这些还都是最常规的分组和聚合运算,遇到对位分组、枚举分组、多重分组等很是规分组加上其余汇集函数 (FIRST,LAST…),代码就变得很是冗长且不通用。若是能有一个中间件专门负责这类计算,采用相似 SQL 脚本作算法描述,在 Java 中直接调用脚本并返回结果集就行了。Java 版集算器和 SPL 脚本,就是这样的机制,下面举例说明如何使用。算法
duty.xlsx 文件中保存着每一个人的加班记录:数据库
汇总每一个人的值班天数:服务器
保存脚本文件CountName.dfx(嵌入 Java 会用到)数据结构
取每月、每一个人、头三天的加班记录函数
保存脚本文件RecMonTop3.dfx(嵌入 Java 会用到)ui
SPL 嵌入到 Java 应用程序十分方便,经过 JDBC 调用存储过程方法加载,用常规分组保存的文件CountName.dfx,示例调用以下:spa
... Connection con = null; Class.forName("com.esproc.jdbc.InternalDriver"); con= DriverManager.getConnection("jdbc:esproc:local://"); //调用存储过程,其中CountName是dfx的文件名 st =(com. esproc.jdbc.InternalCStatement)con.prepareCall("call CountName()"); //执行存储过程 st.execute(); //获取结果集 ResultSet rs = st.getResultSet(); ...
替换成 RecMonTop3.dfx 是一样的道理,只需 call RecMonTop3() 便可,也可同时返回两个结果集。这里只用 Java 片断粗略解释了如何嵌入 SPL,详细步骤请参阅Java 如何调用 SPL 脚本,也很是简单,再也不赘述。同时,SPL 也支持 ODBC 驱动,集成到支持 ODBC 的语言,嵌入过程相似。code
以前没有相关的总结,其实关于数据分组,细分起来其实还有不少种,对位分组、枚举分组、多重分组…,在乾学院 SPL 官方论坛都有总结和示例,这里节选其中两种。中间件
示例 1:按顺序分别列出使用 Chinese、English、French 做为官方语言的国家数量ci
MySQL8: with t(name,ord) as (select 'Chinese',1 union all select 'English',2 union all select 'French',3) select t.name, count(countrycode) cnt from t left join world.countrylanguage s on t.name=s.languagewhere s.isofficial='T' group by name,ord order by ord;
注意:表的字符集和数据库会话的字符集要保持一致。
(1) show variables like ’character_set_connection’查看当前会话字符集
(2) show create table world.countrylanguage 查看表的字符集
(3) set character_set_connection=[字符集] 更新当前会话字符集
集算器 SPL:
A1: 链接数据库
A2: 查询出全部官方语言的记录
A3: 须要列出的语言
A4: 将全部记录按 Language 对位到 A3 相应位置
A5: 构造以语言和使用此语言为官方语言的国家数量的序表
示例 2:按顺序分别列出使用 Chinese、English、French 及其它语言做为官方语言的国家数量
MySQL8: with t(name,ord) as (select 'Chinese',1 union all select 'English',2 union all select 'French',3 union all select 'Other', 4), s(name, cnt) as (select language, count(countrycode) cnt from world.countrylanguage swhere s.isofficial='T' and language in ('Chinese','English','French') group by language union allselect 'Other', count(distinct countrycode) cntfrom world.countrylanguage swhere isofficial='T' and language not in ('Chinese','English','French') ) select t.name, s.cntfrom t left join s using (name) order by t.ord;
集算器 SPL:
A4: 将全部记录按 Language 对位到 A3.to(3) 相应位置,并追加一组用于存放不能对位的记录
A5: 第 4 组计算不一样 CountryCode 的数量
示例 1:按顺序列出各种型城市的数量
MySQL8: with t as (select * from world.city where CountryCode='CHN'), segment(class,start,end) as (select 'tiny', 0, 200000 union all select 'small', 200000, 1000000 union all select 'medium', 1000000, 2000000 union all select 'big', 2000000, 100000000 ) select class, count(1) cnt from segment s join t on t.population>=s.start and t.population<s.endgroup by class, start order by start;
集算器 SPL:
A3: ${…} 宏替换,以大括号内表达式的结果做为新表达式进行计算,结果为序列 [“?<200000”,“?<1000000”,“?<2000000”,“?<100000000”]
A5: 针对 A2 中每条记录,寻找 A3 中第 1 个成立的条件,并追加到对应的组中
示例 2:列出华东地区大型城市数量、其它地区大型城市数量、非大型城市数量
MySQL8: with t as (select * from world.city where CountryCode='CHN') select 'East&Big' class, count(*) cnt from twhere population>=2000000 and district in ('Shanghai','Jiangshu', 'Shandong','Zhejiang','Anhui','Jiangxi') union allselect 'Other&Big', count(*) from twhere population>=2000000 and district not in ('Shanghai','Jiangshu','Shandong','Zhejiang','Anhui','Jiangxi') union allselect 'Not Big', count(*) from twhere population<2000000;
集算器 SPL:
A5: enum@n 将不知足 A4 中全部条件的记录存放到追加的最后一组中
示例 3:列出全部地区大型城市数量、华东地区大型城市数量、非大型城市数量
MySQL8: with t as (select * from world.city where CountryCode='CHN') select 'Big' class, count(*) cnt from twhere population>=2000000 union allselect 'East&Big' class, count(*) cnt from twhere population>=2000000 and district in ('Shanghai','Jiangshu','Shandong','Zhejiang','Anhui','Jiangxi') union allselect 'Not Big' class, count(*) cnt from twhere population<2000000;
集算器 SPL:
A6: 若 A2 中记录知足 A4 中多个条件时,enum@r 会将其追加到对应的每一个组中