超融合架构真的完美吗?

最先大概是由NUTANIX知道“超融合”概念,本来觉得这又是厂商的噱头和炒做,谁知否则,超融合这两年发展如火如荼。2015年被公认为超融合元年,在软件定义存储SDS的推进下,超融合架构正在引领一场巨大的变革,成为软件定义数据中心SDDC的将来技术发展趋势。算法


超融合架构的优点和客户价值这个已经勿容置疑,各个厂商和媒体已经成功地帮客户洗脑了,和客户交流不提超融合都俨然被认为落伍,这里不用也不想再赘述。从辩证角度看,任何事物都不多是完美的,超融合是否是也存在一些问题或局限性呢?超融合有适用场景,但确定不是广泛适用的。所以,这篇文章我想换一个角度来看超融合,找找茬,梳理一下超融合,也算是为你们选择超融合架构方案提供一个参考。容器这么火,不谈好像也不大好,最后简单胡侃一下容器超融合。数据库


1 什么是超融合?
超融合(Hyper- Converged)最先由谁提出这个概念咱不去考证,但目前尚未一个严格的标准定义,各个厂商和机构都有各自标签的定义,这也佐证了超融合仍然处于快速发展演变当中,并未造成统一的标准规范。
服务器


超融合中“超”是什么含义?最开始觉得是超人的Super,结果差点闹出笑话。实际上,“超”对应英文“Hyper-Converged”中的“Hyper”,特指虚拟化,对应虚拟化计算架构,好比ESXi/KVM /XEN/Hyper-V。这一律念最先源自Nutanix等存储初创厂商将Google/Facebook等互联网厂商采用的计算存储融合架构用于虚拟化环境,为企业客户提供一种基于X86硬件平台的计算存储融合产品或解决方案。不难看出,超融合架构中最根本的变化是存储,由原先的集中共享式存储(SAN/NAS)转向软件定义存储,特别是分布式存储(包括Object/Block/File存储),好比NDFS/VSAN/ScaleIO/SSAN。所以基于这个“超”,数据库一体机和大数据一体机都不能划为超融合的范畴,除非RAC/Hadoop等应用跑在虚拟化之上。还有一点,超融合中的软件定义存储一般是分布式存储,ZFS虽然属于SDS范畴,但基于ZFS构建的计算存储融合系统,严格意义上不能称为超融合架构。网络

1-融合两种形态.png


咱们再来看“融合”又是什么含义?超融合这个概念当前彷佛被神化了。简单地讲,融合就是将两个或多个组件组合到一个单元中,组件能够是硬件或软件。就虚拟化和私有云而言,按照是否彻底以虚拟化为中心,我我的把融合分为物理融合和超融合两种。超融合是融合的一个子集,融合是指计算和存储部署在同一个节点上,至关于多个组件部署在一个系统中,同时提供计算和存储能力。物理融合系统中,计算和存储仍然能够是两个独立的组件,没有直接的相互依赖关系。好比,SSAN+oVirt方案,一个节点的Redhat/CentOS系统上SSAN和oVirt物理融合,共享主机的物理资源。超融合与物理融合不一样在于,重点以虚拟化计算为中心,计算和存储紧密相关,存储由虚拟机而非物理机CVM(Controller VM)来控制并将分散的存储资源造成统一的存储池,然后再提供给Hypervisor用于建立应用虚拟机。好比Nutanix和SSAN+vShpere超融合方案。这里狭义的定义才是真正意义上的超融合,Nutanix首次提出这种架构并申请了专利。按照这里的定义,OpenStack+Ceph只是物理融合而非超融合。值得注意的是,出于性能考虑,超融合架构一般都须要将主机物理设备透传(Pass Through)给控制虚机CVM。
架构

2-Nutanix超融合架构.png


下面咱们再看看几个具备表明性的超融合定义:
NUTANIX:超融合架构(简称“HCI”)是指在同一套单元设备中不只仅具有计算、网络、存储和服务器虚拟化等资源和技术,并且还包括备份软件、快照技术、重复数据删除、在线数据压缩等元素,而多套单元设备能够经过网络聚合起来,实现模块化的无缝横向扩展,造成统一的资源池。HCI是实现“软件定义数据中心”的终极技术途径。
运维


Gartner:HCI是一种以软件为中心的体系结构,将计算、存储、网络和虚拟化资源(以及可能的其余技术)紧密集成在单一的供应商提供的一台硬件设备中。分布式


IDC:超融合系统是一种新兴的集成系统,其自己将核心存储、计算和存储网络功能整合到单一的软件解决方案或设备中。该定义与集成基础设施和平台那些由供应商或经销商在出厂时将自主计算,存储和网络系统集成的产品有所不一样。模块化


总结一下以上关于超融合的定义:超融合架构是基于标准通用的硬件平台,经过软件定义实现计算、存储、网络融合,实现以虚拟化为中心的软件定义数据中心的技术架构。这里面有几个关键字:通用硬件平台、软件定义、虚拟化,其中软件定义的分布式存储是核心。如何评判一个系统是否为超融合?我大胆给出一个简单标准。
(1) 彻底软件定义。独立于硬件,采用商业通用标准硬件平台(如X86),彻底采用软件实现计算、存储、网络等功能。
(2) 彻底虚拟化。以虚拟化计算为中心,计算、存储、网络均由虚拟化引擎统一管理和调度,软件定义存储由虚拟机控制器CVM进行管理。
(3) 彻底分布式。横向扩展的分布式系统,计算、存储、网络按需进行动态扩展,系统不存在任意单点故障,采用分布式存储。
微服务


2 超融合与SDS是什么关系?
什么是软件定义存储SDS?软件定义,从SDN开始漫延到计算和存储,软件定义一切已经被认为是技术趋势。和超融合相似,SDS至今没有统一标准的定义,SNIA/IDC/Gartner/VMWare都有各自的定义。就个人理解,软件定义存储是相对采用专用硬件的传统存储系统而言的,采用通用标准的开放式硬件平台,并使用软件实现全部的存储功能,包括数据平面和控制平面。除了实现存储功能,SDS在扩展性、可用性、灵活性、简化管理、下降总成本等方面具备自然的优点。SDS典型的表明有ZFS/NDFS/VSAN/ScaleIO/SSAN/Ceph,这其中ServerSAN居多,它是SDS最重要的产品形态。Wikibon这样定义ServerSAN:由多个独立服务器存储组成的存储资源池,以集群的方式基于IP网络对外提供存储服务。
oop

ServerSAN典型特征包括

(1)    纯粹软件定义,独立于硬件;
(2)    彻底分布式,不存在单点故障;
(3)    系统自治,自动进行故障自愈和数据平衡;
(4)    融合系统,存储和计算部署在相同硬件上;
(5)    横向扩展,最小部署,按需扩容;

3-ServerSAN圈子.png

 

根据Wikibon的调查结果,Server SAN 五年后将超过传统企业存储,成为市场主流,十年后传统存储只有10%的份额,Server SAN已经成为云计算时代的新宠儿。为何以Server SAN为表明的SDS会如此受到市场热捧呢? 究其原因,归结于SDS生得逢时。
(1)    存储需求剧增:应用数据的爆炸式增加;
(2)    硬件摩尔定律:X86硬件,软件定义成为可能;
(3)    高速网络发展:消除网络瓶颈,分布式成为可能;
(4)    革新性的闪存:消除了计算和存储的巨大鸿沟;
(5)    云化数据中心:弹性、性能、融合、管理;
(6)    对TCO的追求:更高的性价比,更低的OPEX;


超融合HCI和软件定义存储SDS是当前两个很是热门的技术领域,它们是构建下一代软件定义数据中心SDDC的最核心构成。从上面的超融合定义看,HCI实现了计算、存储、网络的融合,SDS是超融合架构必不可少的核心组成部分。HCI一般都是由SDS解决方案扩展而来,超融合架构的价值在于它摒弃了专用共享存储系统,突破了传统存储的局限性并知足了云计算带来的新存储需求。换句话说,超融合依赖于SDS,若是没有SDS提供存储功能,超融合架构是不完整的。相反,SDS并不依赖超融合,它能够做为一个独立的软件定义存储系统,替换传统的共享式存储系统,也就是咱们所说的去IOE中的以EMC为表明的传统存储。SDS的优点在于,它不只能够处于HCI的超融合形态,同时它还做为独立存储系统存在,可以为企业级应用提供可行的存储替代方案,在下降存储成本的同时,维持灵活的扩展能力,而且可以利用客户现有的存储架构,充分发挥专用存储网络和存储计算的功用。


超融合方案中重点是Hypervisor和SDS,理想的状态是Hypervisor支持不一样的SDS,而SDS也能够支持不一样的Hypervisor。Hypervisor和SDS厂商分别在各自擅长领域把产品作好,经过深度整合为客户提供更好的超融合方案,实现生态合做双赢。现实的状况是,Hypervisor厂商也要作SDS,SDS厂商也要作Hypervisor,结果致使短板影响超融合方案竞争力,合做演变为更加残酷的直接竞争。典型的案例是,最初 Nutanix和VMWare深度愉快的合做,后面VMWare自研了VSAN就把Nutanix抛弃了,Nutanix只好基于KVM自研了Acropolis hypervisor,从而进入双方直接的竞争态势。所以,要不要彻底打造一个全栈超融合方案,除了技术因素还有深层次的商业因素,这是一个很是值得商榷的问题,对于SDS或云计算领域的初创公司要更加慎重。


3 为何超融合备受青睐?
将来5-10年新一代数据中心基础架构朝着软件定义和超融合方向发展,SAN/NAS存储逐渐被软件定义的存储所替代,超融合架构已经被市场和客户普遍接受,将成为数据中心基础架构的核心。全球最大存储厂商EMC将本身卖给DELL也从侧面印证了传统SAN/NAS存储下滑的态势。超融合架构将成为企业级客户首选,加速业务系统从传统架构向云计算架构的转型。根据Wikibon的分析报告,2016年将是真正云计算落地的开始,超融合和ServerSAN将来市场空间将超过600亿美金,年复合增加率达到20%以上。造成鲜明对比的是,传统存储逐渐被淘汰,将来市场份额仅占10%。超融合市场已经初步造成,传统IT厂商数据中心解决方案已经落后于新技术厂商,将来潜在市场空间是巨大的。

4-Wikibon对ServerSAN市场分析.png

 

根据IDC的预测分析,2015年全球超融合市场将达到8亿美金。若是中国市场按10%的份额来计算,则应该是8000万美金。IDC中国刚刚发布了《2015H1中国超融合市场厂商份额报告》,报告显示2015年上半年中国超融合市场规模达到了39.7百万美圆,几乎是2014整年的1.5倍。2015整年数据目前尚未发布,预计整年将达到1亿美金,这个与全球份额基本是一致的。2015年能够看做是中国超融合市场的元年,2016年颇有可能突破2亿美金。

5-超融合市场.png

 
为何超融合备受青睐?这还得归结超融合架构具备显著的优点,可以带来极高的客户价值。超融合HCI相似Google、Facebook等互联网数据中心的大规模基础架构模式,实现了计算、存储、网络等资源的统一管理和调度,具备更弹性的横向扩展能力,能够为数据中心带来最优的效率、灵活性、规模、成本和数据保护。使用计算存储超融合的一体化平台,替代了传统的服务器加集中式存储的架构,使得整个架构更清晰简单,极大简化了复杂IT系统的设计。相对与传统的IT架构,超融合架构具备自然的优点,下列描述引自Nutanix:
(1)    按需采购:改变采购模式,无需一次性大规模采购,按需采购;保护现有投资,延伸到云计算架构;
(2)    快速交付:从上机架开始30分钟内便可交付使用,部署快速;
(3)    简化管理:单一界面,统一管理计算、存储、虚拟化等资源,运维管理简单化;
(4)    弹性扩展:分布式架构,线性扩展,无节点数限制,无单点故障,内置本地备份、同城和异地容灾能力;
(5)    单一支持:单一厂商保障全部软硬件,包括计算、存储和虚拟化的支持;


以上看上去都是超融合和SDS厂商的自嗨,用于市场宣传推广或控制招标参数,实际真实客户的想法又是如何呢?不如换位思考一下,假如你是客户,为何要选择超融合架构?下面是几个真实的理由,可能超出你的想象,现实就是这么残酷。
(1) 理由1:业务须要
真的是业务需求,而传统的IT架构没法知足或者代价太高,这多是规模、数据可用性、业务连续性、性能等方面的需求。这类客户价值高但比较少,可以主动寻求和接受超融合架构。以性能为例,动辄须要10万以上IOPS的应用,其实并无想象那么多,虽然超融合架构能够轻松达到数十万IOPS。有一个项目,SSAN+vSphere全闪存超融合,上面跑Oracle RAC应用,性能杠杠的,采用普通的SAN阵列很难知足需求。


(2) 理由2:成本
这个实际上是伪需求,传统IT架构能够知足,但成本太高,想节省成本,这类客户占的比例较大。这个没法最大致现超融合的优点,但却每每最能打动客户,毕竟能省钱就是最实惠的收益。有几个实际的客户以前使用EMC/NetApp存储,就是由于成本太高问题而转来采用SSAN+vSphere/oVirt的超融合或物理融合方案。


(3) 理由3:利旧
这种需求其实有点跑偏,本来不是超融合应该作的事情,但实际中倒是真实存在的。企业采购的服务器、存储等IT资源都是固定资产,客户每每但愿将淘汰或过保的这些资源进行利旧,从而达到保护投资的目的。前不久刚实施的一个项目,客户将淘汰下来的一堆IBM服务器,把CPU/Mem/Disk资源拼凑了一下,硬是拼出了4台可以正常运行的服务器,而后部署了一套SSAN做为独立的SDS,为一些企业业务提供存储服务。


4 超融合真的完美吗?
超融合架构的优点和客户价值这个已经勿容置疑,全球和国内市场都已经初步造成,HCI是将来5-10年新一代数据中心基础架构的首选方案。可是,超融合真的是完美的吗?我我的比较喜欢辩证的看问题,超融合是否是存在一些局限或问题呢?下面咱们就来找找茬,同时也是选择超融合架构时须要考虑的因素。
(1)新的信息孤岛
几乎全部的超融合方案都不支持数据中心中原有的外部存储,大多数企业也不可能在短时间内更换整个数据中心基础设施,结果数据中心又分裂成两个彼此独立分散的基础设施孤岛。对于大的数据中心,出于不一样业务需求和平衡考量,颇有可能会同时部署不一样的超融合架构,不一样HCI之间没法整合和互操做,结果就是又多了几个新的信息孤岛。新的信息孤岛带来了资源利用效率和统一管理的问题。


(2)性能一致性问题
数据中心中存储的性能相当重要,并且指望性能是能够预测并保持一致性的,包括延迟、IOPS和带宽,这一点尤为对核心业务系统很关键。对于超融合架构而言,这一点偏偏是很大的挑战。缘由主要有两点,一是超融合架构“共享一切”。计算和存储会争抢CPU/内存/网络等物理资源,并且计算和存储又相互依赖,一旦一方资源需求骤升就是致使另外一方资源枯竭,进而影响性能并在整个基础架构中产生涟漪效应。虽然能够采用cgroup或容器技术进行资源隔离限制,但和非超融合架构的效果仍是不一样的。二是超融合架构“一切分布式和软件定义”,集群规模较大后,网络、硬盘、服务器发生故障的几率都会增大,数据重删/压缩/加密/纠删码等功能都用软件实现,故障的自修复和数据功能实现都会消耗必定的系统资源,致使性能降低和抖动。自修复的流控,数据功能旁路到硬件模块处理,这些方法会缓解性能一致性问题,但彷佛又与超融合的理念相背离。


(3)横向扩展之殃
超融合架构关键特征之一就是易于扩展,最小部署,按需扩容。超融合架构厂商宣称最大集群规模也差异很大,从数十到数千节点不等,一般从3节点起配。超融合中计算能力、存储性能和容量是同步扩容的,没法知足现实中单项能力的扩展,有些厂商还对扩容最小单元有要求,扩展灵活性会受到限制。集群达到必定规模后,系统架构复杂性就会非线性增长,集群管理变的更加困难,硬件故障和自修复发生的几率也会大大增长。所以,咱们是不建议构建大集群的,若是业务容许尽可能构建多个适当规模的较小集群,或者采用大集群中构建故障域或子资源池,光大是不行的。集群扩展还面临一个棘手问题,就是容量均衡。若是存储集群容量很大,均衡是一个很是漫长而痛苦的过程,同时还会对正常的业务负载产生较大的影响。


(4)系统复杂性
超融合架构简化了IT架构,极大下降了数据中心设计的复杂性,实现了快速交付,并极大简化了运维管理。不过,这都是基于用户角度的,从产品研发角度而言,超融合实际上使得内部的软件复杂性更高了。前面咱们已经阐述,超融合架构须要采用CVM虚拟机控制器,而且须要将主机物理设备透传给控制虚机,增长了部署配置管理的复杂性。计算和存储对硬件平台的要求都不一样,融合后也会必定程度上增长兼容性验证的复杂性。超融合架构下,管理、计算、存储、高可用一般都须要配置独立的虚拟网络,网络配置也会更加复杂。同时,共享物理资源的分配、隔离、调度,这也是额外增长的复杂性。还有一点,若是出现故障,问题的跟踪调试和分析诊断也变得更加困难。


(5)SSD分层存储
闪存SSD基本成为超融合架构中必不可少的元素,消除了计算和存储的巨大鸿沟,解决了I/O性能瓶颈问题,尤为是I/O随机读写能力。目前闪存的价格相对HDD磁盘仍是要高于许多,迫于成本因素,全闪超融合方案应用仍然较少,多数应用以SSD混合存储配置为主,从而得到较高的性价比。一般状况下,咱们假设热点数据占10-20%,配置相应比例的SSD存储,采用Cache加速或Tier分层模式将热点数据存储在SSD存储中,一旦热点数据超过预先设置阈值或触发迁移策略,则按相应淘汰算法将较冷数据迁移回HDD磁盘存储,从而指望在性能和容量方面达到总体平衡。看上去很完美是吧?SSD擅长的随机读写,带宽并非它的强项,对于带宽型应用,SSD对性能并无帮助。关于热点数据占比,这个并很差估计,若是SSD配置不足,性能会变得更差。假设应用场景合适而且SSD配置合理,状况又如何呢?SSD空间最终要被热点数据占满,就会触发数据迁移,这时HDD存储仍将成为I/O性能瓶颈,同时还要承担正常的I/O业务负载,总体性能就会出现降级和抖动。为了缓解这一问题,SSD Cache/Tier功能实现中,一方面会过滤掉顺序读写I/O,另外一方面会把空间阈值设置较低,尽早进行数据迁移,同时选择系统空闲时间执行和流控。带来的负面效应是,SSD性能加速效果受限,物理设备效率发挥不充分。另外,SSD自己被写满时性能也会出现较大的波动。所以,SSD混合存储并不是理想模式,实际中咱们推荐根据应用场景采用全闪SSD或全磁盘HDD配置,从而得到一致性的性能表现。若是真的没法全用SSD,还有另一种应用方式,同时建立一个全SSD和一个全HDD存储池,人为按照性能需求将虚拟机分配到不一样存储池中。


(6)企业级数据功能
目前在大多数超融合系统以及SDS系统都具有了核心的企业级功能,包括数据冗余、自动精简配置、快照、克隆、SSD Cache/Tier、数据自动重建、高可用/多路径等数据功能,有些甚至还提供了重复数据删除、数据加密、数据压缩等高级数据功能。然而,相对于高端存储系统,若是超融合架构要承载核心关键应用,还有很大的差距,包括但不限于QoS控制、数据保护、数据迁移、备份容灾、一致性的高性能。核心存储系统应该遵循RAS-P原则,先作好稳定可靠性,其次是企业数据功能完备性,最后才是高性能,这个顺序不能乱,光有高性能是不行的。好比Ceph,企业级数据功能列表多而全,功能规格参数很是诱人,但真正稳定并且可以实际生产部署应用的其实很少。目前,核心关键业务系统还不太敢往超融合架构上迁移,主要仍是从非核心业务开始检验,毕竟超融合出现时间还比较短,须要更多的时间和实践验证RAS-P特性。可是,将来超融合一定是核心关键业务的主流架构。


(7)物理环境应用
目前广泛公认的适合应用场景是桌面云、服务器虚拟化、OpenStack私有云、大数据分析等新型应用。理论上超融合系统能够适用于IT环境的全部应用类型,须要注意的是,超融合系统管理虚拟化环境,而更多的传统IT应用仍然运行在物理服务器和传统存储系统之上。咱们能够乐观地认为没有哪种应用程序不能被部署在超融合基础架构上,可是考虑到运行效率、硬件依赖性以及和虚拟化环境兼容性等因素,不少IT应用最好仍是继续保持运行在物理硬件架构,好比数据库应用、实时控制系统以及大量遗留IT系统。


(8)异构虚拟化环境
目前超融合方案一般是仅支持一种虚拟化环境,Nutanix能够支持多种虚拟化环境,可是对于一套超融合架构部署,实际上也仅支持一种虚拟化环境。每种虚拟化环境都有各自的优点,不少企业可能须要同时运行几种虚拟化环境,好比VMware、KVM、Hyper-V、XEN,由于超融合不支持异构虚拟化环境,须要部署多套超融合架构,这就是新的信息孤岛。客户很是但愿看到支持异构虚拟化环境的超融合架构方案。


(9)超融合数据共享
超融合架构采用软件定义存储替换传统的共享式存储解决了虚拟化存储问题,这里的SDS实际上主要是指ServerSAN,提供分布式块存储。然而不管是虚拟机仍是物理机,实际IT应用都有着数据共享需求,须要分布式文件系统或NAS存储系统。这是目前超融合广泛缺失的,现实仍是依赖外部独立部署的NAS或集群NAS存储系统,好比GlusterFS、ZFS。从技术架构和实现来讲,一个SDS系统很好地统一支持Object/Block/File存储,这个很是难以实现的。好比Ceph,它的CephFS一直没有达到生产环境部署标准,更别提性能。所以,超融合架构中能够采用相同方式同时部署两套SDS存储,分别提供分布式块存储和文件系统文件共享存储,好比SSAN和GlusterFS,没必要非得要求分布式统一存储。


(10)全栈超融合架构
目前不少厂商都在推超融合架构方案,其中一部分是SDS厂商,一部分是虚拟化厂商,还有更多的是集成商,像VMware/Nutanix同时作SDS和虚拟化的厂商很是少。SDS和虚拟化是两个彻底迥异的领域,并且技术门槛都很是高,一个厂商同时把这两块都作到很好是很是难的。二者都想作的厂商,无非是想控制成本、自主可控、扩大市场、融资好讲故事。对于初创公司,团队和资金很是有限,打造全栈超融合架构更是困难重重。正确的姿态多是,肯定战略方向重点作好一块,而后再找另外一块作得好的厂商进行战略生态合做,强强联手打造有竞争力的超融合架构方式,不管从产品技术仍是市场角度都是共赢的。


5 容器要不要超融合?
容器是个神奇的东西,火热程度绝不逊色于超融合,它正在引领一场云化数据中心架构的新变革,而被革命的对象是目前尚未大行其道的超融合架构,许多企业已经或正在将应用从虚拟机迁移到容器上。那么什么是容器?简单讲容器就是主机上被隔离的进程,它运行在沙盒之中,借助CGroup/Namspace技术限定和隔离所使用的主机物理资源。为何容器这么受热捧?虚拟机管理程序对整个设备进行抽象处理,一般对系统要求很高,而容器只是对操做系统内核进行抽象处理,使用共享的操做系统,能够更加高效地使用系统资源,相同的硬件能够建立的容器数量是虚拟机的4-6倍。这能够为数据中心节省大量的成本,同时能够快速构建随处运行的容器化应用,并简化部署和管理。“最小部署,按需扩容”,这是云计算要解决的弹性扩展问题。容器相对虚拟机很是轻量级,它能解决的根本问题就是提高效率和速度,从而实现秒级的扩展(包括缩容)。正是这些显著优点,容器很是有潜力替换虚拟机成为云计算的基础架构,这么火热天然就能够理解了。值得一提的是,并非全部应用都要容器化,关键要看业务是否适合高度弹性计算的微服务,不能盲目推崇。


容器是用来承载应用的,其设计就是为了应用的运行环境打包,启动,迁移,弹性扩展,容器一个最重要的特性就是无状态,能够根据须要动态建立和销毁。然而,并非全部应用都是无状态的,对于有状态的容器怎么办?容器中须要持久化的数据即状态,这是不能随便丢弃的。如何持久化保存容器的数据,这是自Docker诞生之日起就一直存在的问题。广泛的见解是不该该把数据放到容器中,最好保证全部容器都是无状态的,但仍是要提供保存状态的内部机制。Docker 惟一与状态有关的概念是volume,容器访问外部应用数据接口,彻底脱离Docker的管制。Volume解决了容器的数据持久化存储问题,但它仅仅是一个数据接口,容器自己并不负责持久化数据的管理。这个问题几乎被全部容器厂商忽略,主要依靠外部存储来解决,其中一种解决方案是把容器数据持久保存在可靠的分布式存储中,好比GlusterFS、Ceph,管理员不用再考虑容器数据的迁移问题。


容器里面直接跑的应用,它天生比虚拟机VM更接近应用,最能经过应用感知对存储的深层次需求,从而动态配置不一样的存储策略。所以,为容器提供状态持久化的外部存储系统,应该是面向应用的存储系统,它针对不一样类型应用的容器提供精细的存储策略,并进行动态智能应用感知。那么,容器计算+应用感知存储要不要超融合?这里咱们定义一下容器超融合:采用分布式存储,彻底容器化,存储控制器也容器化。容器自然应该是无状态的,它的职能是实现敏捷的弹性计算,若是容器是有状态的,这个优点会被极大减弱。分布式存储都是比较重的系统,好比Ceph,GlusterFS,须要管理大量的磁盘和网络资源,自己并不适合容器化,它们更适合直接运行在原生的物理机操做系统中。分布式存储对状态要求很严格,若是把应用容器和存储控制器容器融合在一个,存储状态的变化会严重影响到应用。所以,我我的理解容器本质上是不须要作所谓的超融合,容器重点作好弹性的云计算架构,分布式存储则重点作好可容器感知的应用存储,须要有状态则由独立的外部专业存储来负责,经过容器提供的存储机制进行数据访问,如Rancher Convoy或者Flocker容器存储驱动。实际上,有状态的容器需求很是少,这也是为何容器存储被忽视的重要缘由。最后,容器与虚拟机VM最大区别就是它不是VM,容器超融合这个说法也不对。

(全文完)