数据仓库模型之表命名规范

以下总结阿里关于数据仓库中表的命名规范。

一、命名规则综述

命名所用术语。
指标命名,尽量使用英文简写,其次是英文,指标英文名太长时,可考虑用汉语拼音首字母命名。如中国质造,zgzc 。以用来进行命名。(建议公司自己建立自己指标字典表来对指标进行规范和同意)
业务过程。
英文名:用英文或英文的缩写或者中文拼音简写或中文名:具体的业务过程中文即可,
例如:关于存量型指标对应的业务过程的约定,采用实体对象英文名+_stock 。(如在线会员数、 一星会员数等 ,其对应的业务过程为mbr_stock1 在线商品数、商品 SKU 种类小于 的商品数,其对应的业
务过程 itm_stock)。 如内容订阅关注 sns_follow
原子指标
英文名 :动作+度量:中文名:动作+度量。原子指标必须挂靠在某个业务过程下(待理解)如支付金额 pay_ord_amt
修饰词
只有时间周期才会有英文名,且长度为 位,加上“一”为3位,例如一ld 。其他修饰词无英文名。
例如时间周期修饰词:
在这里插入图片描述
派生指标
英文名原子指标英文名+时间周期修饰词( 位,例如_Id) +序号( 4位,例如一001 );中文名:时间周期修饰词+[其他修饰词]+原子指标。如支付转化率指数 :vst_pay_byr_rate_index_1d_002
(注意:阿里引入序号的目的是,为了控制派生指标的英文名称过长,在英文名的理解和规范上做了
取舍,所有修饰词的含义都纳入了序号中。序号是根据原子指标+派生指标自增的。自己的业务中可以对序号做取舍,做对应关系映射)
派生指标分类:事务型指标、存量型指标和复合型指标。按照其特性不同,有些必须新建原子指标,有些可以在其他类型原子指标的基础上增加修饰词形成派生指标。
1事务型指标: 是指对业务活动进行衡量的指标。例如新发商品数、重发商品数、新增注册会员数、订单支付金额,这类指标需维护原子指标及修饰词,在此基础上创建派生指标。
2、存量型指标:是指对实体对象(如商品、会员)某些状态的统计。例如商品总数、注册会员总数,这类指标需维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期 般为“历史截
至当前某个时间”。
3、复合型指标:是在事务型指标和存量型指标的基础上复合而成的。例如浏览 UV-下单买家数转化率 有些需要 建新原子指标,有些则可以在事务型或存量型原子指标的基础上增加修饰词得到派生指标。
(注意:其复合型指标下又包含很多小的分类例如:比率型、比例型、变化量型、变化率型、统计型、排名型等)

其他规则
1、上下层级派生指标同时存在时
如最近 天支付金额和最近 PC 端支付金额,建议使用前者,把PC 端作为维度属性存放在物理表中体现。
2、父子关系原子指标存在时
当父子关系原子指标存在时,派生指标使用子原子指标创建派生指标。如 PV IPV (商品详情页 PV ),当统计商品详情页 PV 时,优先选择子原子指标。

二、工作关于数仓命名规范实践

todo 总结