大数据之BI开发 - 维度建立

      用多维数据库中的点,表示对业务的度量结果。在各类各样的市场销售产品,并不断对企业各种业务的表现进行度量。数据库

 

术语汇总结合图ide

 

 

 

相关概念工具

 

  • 事实(表示某个业务度量)表:用于度量

存储组织机构业务过程事件的性能度量结果;每一行数据是一个特定级别的细节数据 ;事实表的主键,是外键集合(组合键) 。性能

 

  • 维度表:用于描述环境

一般有多列,或者说多个属性 。用于描述与“谁、什么时候、哪里、为何、如何、什么”有关的事件 大数据

 

  • 事实表与维度表的链接,遵循简单和对称性。

 

 

  • 星型模型与雪花模型:根据事实表和维度表的关系
    • 星型模型:

 

    • 雪花模型:

 

 

参考:spa

  • 大数据查询系统:Hive、Impala、Spark  SQL、Kylin
  • 查询速度与被查询数据总量之间的关系:给定硬件条件下,假设数据总量为N( 1)查询时间随着数据量的增加而线性增加,O(N) ;2)查询时间不随数据量增加而增加,O(1) )
  • 大数据查询相关的关键技术:列式存储;并行计算;内存计算
  • SQL SERVER中ETL工具 - AS:项目中的Cube  https://v.kuaishou.com/bdZ6cy

相关文章
相关标签/搜索