广义上来讲,Hadoop大数据平台也能够看作是新一代的数据仓库系统, 它也具备不少现代数据仓库的特征,也被企业所普遍使用。由于MPP架构的可扩展性,基于MPP的数据仓库系统有时候也被划分到大数据平台类产品。数据库
可是数据仓库和Hadoop平台仍是有不少显著的不一样。针对不一样的使用场景其发挥的做用和给用户带来的体验也不经相同。用户能够根据下表简单判断什么场景更适合用什么样的产品。编程
特性架构 |
Hadoop编程语言 |
Data Warehouseoop |
计算节点数大数据 |
可到数千个人工智能 |
通常在128个之内spa |
数据量视频 |
支持大于10PB接口 |
通常不大于5PB |
数据类型 |
关系型,半关系型,无结构化,语音,图像,视频 |
关系型 |
时延 |
中/高 |
低 |
应用生态 |
创新型/人工智能 |
传统数据库型/BI类 |
应用开发接口 |
SQL,MR,丰富的编程语言接口 |
标准数据库SQL |
可扩展性 |
无穷的可能,完整的编程接口 |
有限扩展能力,主要经过UDF支持 |
事务支持 |
有限 |
完整 |
数据仓库和Hadoop平台互为补充,立足于知足客户在不一样使用场景下的业务需求。公有云数据仓库服务DWS可以无缝地接入到公有云Hadoop平台MRS服务上,支持SQL-over-Hadoop的这个特性,提供跨平台, 跨服务的数据共享。让用户在充分享受Hadoop带来的开放,便捷,创新的同时,继续使用熟悉的数据(仓)库方式管理和使用本身的海量数据。继续使用传统的数据仓库的上层应用,特别是商业智能BI类的应用。