dmp学习

接触项目: 1.搭环境 2.了解项目组架构,数据存在哪里,用到什么计算引擎 存储层kudu 计算层spark sparkGraphx(统一用户识别) 快速查询层 impala 数据展示层 zeeplin 实现数据图表化 根据数据类型选择存储引擎 (hdfs hbase kudu) 静态数据:保存后不会进行修改。以日志数据为主,数据量大—>hdfs存储,高吞吐量,随机读写能力比较弱。 动态数据:吞吐
相关文章
相关标签/搜索