随着超融合在国内市场兴起并逐步成为主流,一场针对于IT基础架构的技术变革悄然而至。沿用二十多年的传统IT架构面临着新一代架构的严重冲击。近几年来,面对巨大的市场机遇,超融合厂商也如雨后春笋,不断涌现。企业用户的数字化转型发展得益于超融合架构的创新推进,但同时也面临着如何评测和遴选优质厂商及产品的难题。web
这些主流国内外超融合厂商到底有哪些区别?他们产品有何优劣势?到底应该从那几方面去评测超融合架构才能拨开迷雾?本篇文章便要深度对比分析市场各主流超融合和厂商,帮助超融合入门用户全面而深刻地理解超融合概念,并能从核心关键方面来了解不一样厂商及产品的特色,从而结合企业的状况进行有针对性的评估与选择。算法
超融合是一种 IT 基础架构构建方式,其核心思想是使用通用硬件,用软件定义来实现 IT 基础架构的各项服务,包括:计算,存储,灾备,运维管理等,而且这些服务都在统一的平台上。安全
超融合概念包含三个要素:服务器
可见超融合是一个概念,而不是一个技术,明确这一点对于理解超融合自己很是重要。不一样超融合产品和厂商的区别或差距不在概念自己,而在超融合背后的技术和实现方式。一个简单的类比:“汽车”就是一个概念,字典里的解释是:“一般为四轮的自动车,用于街道和公路运输”。这里至于若是实现这个概念并无作规定和限制,因此不管是纯电动的特斯拉,福田小卡,高尔夫球车,都是知足上面的定义,可是使用场景和背后的实现,可谓天壤之别。网络
明白了超融合只是概念,进一步的问题:各厂商超融合产品的实现有哪些不一样?这个问题才是选择超融合真正的关注点,展开来有四个子问题:架构
1) 分布式存储打破数据孤岛运维
虽然说超融合经过软件定义的方式整合了多个 IT 服务,但其中软件定义存储是基石。这里须要说明一下:池化服务器的本地存储,要求软件定义存储必须是分布式的,且能被虚拟机挂在成虚拟卷使用,不加特殊的说明,超融合平台里的软件定义存储指的是分布式块存储。分布式
没有稳定可靠的分布式块存储,就没法对外提供统一的存储资源抽象,没有统一的抽象,各个服务器的本地存储就是一个个数据孤岛,与传统的单机存储没有区别。因此,讨论超融合平台却不讨论分布式块存储,而拈轻怕重的展现平台 IT 服务的种类,更甚者居然用支持 IT 种类的多少做为超融合的代数标准,基本能够断定是一种“误导”,本质是这类厂商不具有超融合与分布式存储的研发能力。主流核心厂商都无一例外的在分布式块存储上有着核心的竞争力和自主研发能力,好比:Nutanix Acropolis Enterprise Storage (内部以前叫 NDFS), VMware VSAN ,SmartX ZBS等 都是对应超融合平台里的核心分布式存储。svg
2)虚拟化计算一样不可或缺工具
虚拟化计算是超融合平台另外一个不可或缺的服务,有了存储和计算就有了最基本的 IT 基础架构,不少厂商也会一部分网络服务的功能归入到虚拟化计算。因为 Hypervisor 的技术相对成熟,不管是闭源的 VMware ESXi 仍是开源的 KVM,不管功能仍是性能都经过了不少年市场验证。因此虚拟化计算服务在超融合平台上基本集中在 VMware 产品和 基于 KVM 自研的产品,如:Nutanix 的 AHV(基于 KVM),VMware 的 vSphere(基于 ESXi),SmartX 的 Elf(基于 KVM)等。固然 Nutanix 和 SmartX 也一样支持 VMware 虚拟化计算平台,并且借助其强大的存储服务,总体超融合平台的表现甚至还要优于 VMware。
3)一个平台管理多个IT服务,运维简化是趋势
随着单个服务器计算能力愈来愈强,愈来愈多的 IT 服务其实均可以经过软件定义的方式来实现,如:灾备服务、全闪存、容器服务、网络服务、安全服务等。
一个平台上有多个 IT 服务是一种趋势,伴随着革命性的变化就是:传统架构下须要运维管理多个 IT 平台,在超融合下,一套管理平台就够了,这就为从全新的角度审视 IT 运维,提供了极大的想象空间。同时,在超融合架构下实现强大好用的统一管理平台,其重要性和优先级也被提高到史无前例的高度。像超融合领导厂商 Nutanix,SmartX 等,在运维管理平台上都下足了功夫,分别推出了智能强大的管理平台:Nutanix Prism 和 SmartX Fisheye,极大的提高系统的易用性。
总结一下就是,超融合平台里分布式块存储、虚拟化计算和统一运维管理平台是最小,也是最核心的集合,缺乏任何一个都没法称做超融合平台。但随着硬件的发展,更多的服务势必会在超融合平台里实现。
评测超融合产品,关键不是看包含了哪些 IT 服务,向超融合这个“盒子”里塞更多的 IT 服务远不如塞进“盒子”IT 服务的质量重要。一些厂商借助客户对超融合市场认知的不成熟,会一味的拼超融合平台上服务和功能的数量。一般的作法就是拿开源的项目,如:“OpenStack + 开源分布式存储 (Ceph/GlusterFS…)” 搭一个功能看似大而全的“超融合平台”快速推向市场。能够看到,几乎没有用户最终可以真正的用起来,缘由在于这种拼凑的“超融合”产品每每各个服务组件的质量没法过关,在可靠性,稳定性,性能方面问题多多,加上开源社区基本不在这些 厂商的控制之下,所谓的售后支持形同虚设,很难达到一个产品应该拥有的市场准备度。
1)实现机制是核心
服务的核心在于实现它的技术和机制。举一个手机电池的例子,为了实现手机长续航的能力,一家厂商简单的增长电池块的容量,另外一家公司采用的是优化手机软件的电池管理算法,即使最后的测试下来都能续航两天,但第一家手机在续航的实现机制上是不如第二家的,由于增长电池块会引发手机发烫,而且有电池爆炸的风险,但这些缺陷没法在测试续航时间这个指标里得以体现。
一样的道理适用于超融合产品。超融合产品比拼最重要的必然是分布式块存储、虚拟化计算、运维管理平台的实现。
重中之重是软件定义存储,它是超融合平台的基石。当前市场里各家超融合平台分布式块存储的实现无非是两个途径:
开源最大的好处是产品上市的周期可极大的缩短,最大的风险除了存储的稳定性没有保障,还有就是厂商对存储的控制力和维护能力几乎没有,存储系统不比其它系统,守护着企业最重要的数据,一旦发生问题就会陷入一筹莫展的失控境地,给企业带来的损失是惨重而不可估量。
这里有一个不可忽视的事实,国外知名超融合厂商无一例外的都走了自主研发的道路,也证明了在成熟的市场环境下,用户会理性的选择自主可控且有保障的产品。纵观 IT 发展的历史,甚至没有一家存储公司,使用开源的存储项目来实现自家的存储产品,并取得产品和商业的成功。再次验证了,存储关乎业务的连续性、数据的可靠性和安全性。没有一家企业客户“敢”把本身的业务托付给不可控的存储产品。
市场上全部的分布式块存储架构基本能够收敛到两种,一种数据放置和分布依赖元数据服务,另外一种数据放置和分布依赖一致性哈希。但就分布式块存储自己而言,两种数据架构各有千秋。但在超融合场景上,元数据服务的方式有更多的优点,数据的放置更灵活可控,如:VM 数据本地化能缩短 I/O 路径,大大减小网络流量。采用这种架构的产品有 Nutanix NDFS 和 SmartX ZBS。
其次是虚拟化计算,与存储不一样的是,虚拟化的核心技术 Hypervisor 相对成熟。各超融合产品更多比拼的是虚拟化平台的支持能力。支持多种虚拟化平台意味着更少的厂商绑定的风险。此外,是否支持虚拟化的特殊接口也是很重要的指标,它直接影响使用体验和维护支持,好比:VMware VAAI/VVol,Citrix Ready 等。这块比较优秀的国外厂商是 Nutanix,几乎支持全部的虚拟化平台;国内厂商 SmartX、华为支持除 Hyper-v 之外的全部虚拟化平台;VMware 只支持自家的虚拟化平台,开源超融合方案通常只支持 KVM。
KVM 做为开源的 Hypervisor 被不少厂商选用,但各家须要实现本身的虚拟化计算管理平台,除了基本的 VM 生命周期管理,还至少须要实现企业级经常使用的功能,如:VM HA、、虚拟分布式交换机、共享盘等。
除了存储和计算,其余 IT 服务或多或少会依赖以上两类核心服务,好比:容灾和备份依赖存储服务;容器编排依赖计算服务。
2)资源消耗需着重评估
除了服务的实现机制,超融合平台有一项特殊的要求:资源消耗要尽量的小。超融合场景下,消耗大量的资源是绝对不能接受的,每一个物理服务器除了运行存储、计算等多个 IT 服务,还要把剩余的资源分配留给业务应用,IT 服务占用资源越大,留给业务应用的资源就越小,甚至挤压到业务没法运行。资源消耗不只节省 TCO 的指标,更是影响超融合实用性的重要变量。
如下收集了各厂商分布式块存储产品的资源消耗状况。
1)各有利弊的三类服务整合方式
服务整合广义是超融合平台上各服务的结合方式,但业内讨论更多的是存储与虚拟化的整合。大体能够分为三类:
2)管理与运维好才能发挥出超融合的优点
因为涉及比传统平台更多的 IT 服务,超融合更增强调管理平台的重要性和易用性。强大好用的管理平台能大大提高运维效率,下降运维成本,将超融合架构敏捷的特性发挥得淋漓尽致。
超融合厂商产品家的管理平台一览:
一个优秀的超融合管理平台应该涵盖产品从交付到平常运维的方方面面:
超融合依托标准的 x86 服务器,通常能够是安装了超融合软件的一体机或者是独立的软件受权。当前主流厂商支持的交付方式以下: