摘要: 2019年1月18日,由阿里巴巴MaxCompute开发者社区和阿里云栖社区联合主办的“阿里云栖开发者沙龙大数据技术专场”走近北京联合大学,本次技术沙龙上,人人车大数据平台负责人吴水永从人人车数据平台的总体架构、如何基于阿里云打造一个轻盈的数据平台以及人人车企业基于阿里云技术开发的BI数据报表平台等三个方面进行了精彩分享。数据库
如下内容根据演讲视频以及PPT整理而成。安全
快速搭建,一年时间完成6大平台的搭建微信
基于阿里云平台上成熟的技术,人人车企业只用了一年时间便实现了6大数据平台的设计与搭建,其中包括:Jarvis-BI报表平台、Metadata-元数据管理平台、Streaming-实时计算平台、Athena-数据工单平台、Cateye-监控平台与AD-HOC-自助取数平台。架构
上述数据平台的最底层均由阿里云的相关技术支撑运行,阿里云为平台的搭建提供了两种不一样技术的支持,在储存计算技术方面,阿里云提供了 RDS云数据库、MaxCompute大数据计算平台、OSS对象储存等储蓄技术。在云通讯技术方面,阿里云一样提供了SLB、DTS、DataX、CDN等云通道技术。并发
企业遵循阿里云 “One Data,One Server,One Meta”理念进行平台的设计与实现。“One Data”这里表示统一的数据源,企业将全部数据出口汇总到MaxCompute并在Hadoop集群上搭建统一的数据源。围绕统一的数据源,企业搭建了许多相关业务的搜索引擎,包括:Spark、Clickhouse、Presto、Druid.io等。在搜索引擎的基础上,平台基于“One Server”的设计思想封装了统一的DataServer为这些搜索引擎提供上层数据服务。“One Meta”表明统一的元数据,元数据至关于数据流中的骨架,企业设计并实现的元数据管理平台很好地完成了对元数据的管理任务,经过元数据企业能够更好的管理数据权限及各类数据指标。人人车企业基于阿里云的技术与思想打造的数据平台轻盈可靠,为企业带来了很高的效益。高并发
以下图所示,在阿里云技术的基础上,人人车数据平台的数据流实现分为如下4层:工具
基于数据驱动理念及市场的需求,人人车企业基于阿里云成熟的MaxCompute技术尝试设计搭建了企业本身的数据仓库。在阿里云便捷的方案与稳定技术的支持下,企业的数据仓库搭建顺利成功,目前已开始为公司贡献数据上的效益。oop
1. 数据仓库能够解决什么问题?性能
创建数据仓库能够为整个工程提供一个良好的数据体系,解决异构数据源工程开发中的口径版本不1、效率低下、缺少可信度等问题。数据平台的开发是由良好的顶层设计来决定底层建筑的过程,优秀的数据平台设计方案在实现过程当中会为开发团队节省大量的人力与时间。搭建一个标准的数据仓库,便是完成数据平台顶层设计的第一步。大数据
2.数据仓库的标准
企业业务上经常使用的数据仓库为三段式模型,目前最为流行的是基于主题内容的Inmon模型与基于维度的Kimball模型。这两种建模的目标都是创建一个更高效、稳定、灵活的数据仓库模型。企业能够从耦合度、性能与成本、效率与质量这三大维度选择合适本身业务的数据仓库模型。在数据仓库搭建的实施过程当中,人人车平台选择在阿里云的MaxCompute服务基础上进行企业数据仓库的搭建。以下图所示,经过阿里云MaxCompute服务搭建的数据仓库从如下五大方面为人人车的数据仓库搭建带来了便利:
3.平台数据仓库结构
以下图所示,人人车平台数据仓库的结构分为如下几层:
4.基于MaxCompute搭建的数据仓库效果
以下图所示,是人人车平台基于阿里云MaxCompute搭建的数据仓库的运行数据。经过阿里云的MaxCompute,人人车平台实现了快速高效搭建数据仓库的愿景。平台所搭建的数据仓库安全可靠,运行平稳,而且在每日数据峰值阶段的表现优异。同时,经过使用阿里云的服务搭建数据仓库,企业节省了不少没必要要的开销。
5.数据同步问题
在数据仓库的实现过程当中,数据同步是一大难题。阿里云提供了一些便捷的标准接口帮助企业更方便地将数据同步到MySQL之外的设备上。企业能够对这些标准化的接口进行个性化的定义,以此方便自身业务的开发与编写。
6.数据仓库最佳实践
在数据仓库的设计与实践过程当中,人人车平台总结了如下一些经验:
人人车企业以阿里云技术为基础设计并实践的另外一大成果是BI数据报表平台,经过BI数据报表平台,企业完成了对市场数据的轻松掌控,并大大提升了自身决策的准确度。
1. 方案的选择--论POC以及TPC的重要性
在BI报表平台实现的方案中,人人车采用了POC模式与TPC模型来实现。
POC模式意为产品原型验证模式,开发者在产品原型验证模式下须要去了解客户的基础需求,经过理解用户的需求为用户搭建一个业务原型场景。
TPC-DS模型是设计数据库经常会用到的模型,其中包括:关系模型、星型模型及雪花模型,其优秀的工做负载能力能够为系统带来很高的稳定性。
2.ClickHouse数据管理系统
ClickHouse数据库管理系统开发自俄罗斯,系统拥有以下优势:
3.BI数据报表平台架构
以下图所示为BI数据报表平台的架构示意图,平台的架构能够分为如下几大部分:
下图为系统使用时的效果图。在编辑图表的过程当中,使用者能够按照本身所想自由的拖拽拉动数据图表,实现数据图表的简单化操做。基于大数据统计出的表格会将数据的特色直观地表现给用户,大大方便了用户的使用。
下图所示为BI数据报表平台在移动端的效果图。
4.BI数据报表平台的优点
BI数据报表平台除了其方便操做的特色外,还为使用者带来了如下优点技术:
在上述架构与优点技术的支持下,BI数据报表平台具有下列特色:
5.BI数据报表平台搭建时的经验
在BI数据平台的设计与搭建中,人人车平台也摸索总结了不少经验:
6.BI数据报表平台的数据驱动
BI平台使用了数据驱动的运营方式,仅对用户最感兴趣的几个指标项进行考核,将考核获得的结果与业绩直接挂钩,实现用户在掌上查看相关数据,大大方便用户的工做与生活。
原文连接 更多技术干货 请关注阿里云云栖社区微信号 :yunqiinsight