数据仓库概念

1、项目需求java

  • 数据采集平台搭建
  • 实现用户行为数据仓库的分层搭建
  • 实现业务数据仓库的分层搭建
  • 针对数据仓库中的数据进行留存、转换率、GMV、复购率、活跃等报表分析

2、思考题sql

  • 项目技术如何选型
  • 框架版本如何选型(如Apache、CDH、HDP)
  • 服务器使用物理机仍是云主机
  • 如何确认集群规模?(假设每台服务器8t硬盘)

技术选型:api

数据采集传输Flume、Kafka、Sqoop、Logstash、 DataX服务器

数据存储Mysql、HDFS、HBase、Redis、MongoDB框架

数据计算Hive、Tez、Spark、Flink、Stormoop

数据查询Presto、Druid、Impala、Kylinui

 

问题:spa

kafka消息存HDFS方法?设计

java代码消费,而后调用HDFS上传api或者经过Flumerest

 

系统数据流程设计

相关文章
相关标签/搜索