提及Ceph,可能更多的人仍是经过OpenStack认识了它,但实际上,Ceph的诞生比OpenStack还要早上许多年。2004年,Sage Weil在加州大学Santa Cruz分校攻读博士期间,发明了Ceph,2006年,在著名的OSDI学术会议上,Sege发表了Ceph的论文,今后,Ceph才开始逐渐为人所知。随着OpenStack的迅速发展,Ceph搭上了OpenStack的春风,受到各大厂商的追捧,Intel、DreamHost、SanDisk、CISCO、Yahoo等公司都或多或少的参与其中。RedHat更是一掷千金,直接砸了1.75亿美金将Sage建立的Inktank公司及其Ceph团队收入囊中,将其做为IaaS三大组件计算、网络、存储之一,Ceph今后名震天下,Ceph更是成为OpenStack后端存储的惟一标配。算法
那么,Ceph究竟是什么?它凭什么能够成为OpenStack后端存储的标配?要谈论这个话题,恐怕没有人可以比Ceph项目的创始人Sege Weil先生更有资格了,而就在3月22日首次在中国举办的Cephalocon APAC 2018上,Sege Weil先生亲自来华,所以,老孙也有幸请Sege Weil先生本身来回答了这些问题。后端
“2004年我创立Ceph项目的时候,当时的初衷是为一个超算中内心面的超级计算机提供PB级存储方案,所以,Ceph其实是一个高性能分布式文件系统,而后,随着OpenStack的出现,我发现这个项目可以为以OpenStack为核心的云计算提供存储基础设施,从而能够从仅仅为超算中心提供分布式文件系统扩展到为更多的数据中心提供存储基础设施的支持,所以,咱们开始对Ceph进行针对云计算基础设施的改进和优化,Ceph设计之初仅针对对象存储,而云计算不只须要对象存储还须要块存储和文件存储,因此这些年来,Ceph增长了对这些功能的所有支持,所以Ceph如今已经可以充分知足云计算数据中心的需求。”网络
Ceph创立的初衷并不是是为了OpenStack,但Ceph最终会成为OpenStack后端存储标配,首先固然是因为Ceph可以与OpenStack无缝的结合,但Ceph自己在技术上的创新也是Ceph可以取得成功的关键。架构
最关键的创新,是Ceph可以同时提供对象存储、块存储和文件系统存储三种存储服务的统一存储架构,所以可以知足不一样应用需求前提下的简化部署和运维,这是Ceph被OpenStack用户热衷的最主要缘由。运维
其次,是Crush算法。Crush算法是Ceph的两大创新之一,经过Crush算法的寻址操做,Ceph得以摒弃了传统的集中式存储元数据寻址方案。而Crush算法在一致性哈希基础上很好的考虑了容灾域的隔离,使得Ceph可以实现各种负载的副本放置规则,例如跨机房、机架感知等。同时,Crush算法有至关强大的扩展性,理论上能够支持数千个存储节点,这为Ceph在大规模云环境中的应用提供了先天的便利。异步
第三,Ceph中的数据副本数量能够由管理员自行定义,并能够经过Crush算法指定副本的物理存储位置以分隔故障域,支持数据强一致性的特性也使Ceph具备了高可靠性,能够忍受多种故障场景并自动尝试并行修复。而Ceph自己没有主控节点,扩展起来比较容易,而且理论上,它的性能会随着磁盘数量的增长而线性增加,这又使得Ceph具有了云计算所应该拥有的高扩展性。所以,Ceph可以得到OpenStack用户的青睐也就不足为奇了。分布式
虽然Ceph有不少优势,也被OpenStack所推崇,但Ceph并不是是尽善尽美,Sege也很大方的认可了这一点,他认为,Ceph在性能、易用和节能方面还有很大的提高空间,同时,Ceph在数据去重、压缩、同步、异步等企业级功能方面也有所欠缺。性能
红帽首席方案架构师张家驹则表示,Ceph来自于社区,Ceph社区的繁荣是毋庸置疑的,但从另一方面讲,社区是比较松散的结构,所以社区版的Ceph在产品的功能性,企业级特性方面都会有所欠缺,而解决这一问题的最有效途径就是由专业的厂商,对社区版Ceph进行产品化,作出一个稳定的企业级产品。同时,专业厂商对Ceph产品的改进和优化也会回馈给社区版产品,从而保证Ceph可以持续不断的向前发展。优化
在谈到Ceph的将来会不会成为今天的OpenStack时,张家驹认为,“OpenStack和Ceph是一块儿成长起来的,没有Ceph,OpenStack可能也不会这么火,OpenStack更可能是在控制面,Ceph关注的则是数据面,这是两个方向的发展,控制面技术发展到今天可能出现了一些演化的趋势,好比出现了一些容器和其余的一些东西,可是OpenStack和Ceph有各自不一样的应用场景,做为红帽来看,咱们发现控制面有逐渐演化的趋势,可是数据面看到的只有Ceph,咱们一开始从计算领域到云到对接容器,是逐渐演化成熟的过程,因此至少在目前咱们并无看到分布式存储的领域里有能够替代Ceph的技术,将来是会变化的,而做为Ceph来说,咱们会不断的适应新变化,对接新的软件堆栈,不断的适应新的应用场景,包括不断的对应新型的硬件,而当硬件发生变化的时候,软件以前的性能瓶颈就可以天然而然的克服,我以为Ceph目前在开源存储领域是一个很是火爆而且很是团结的社区,因此会有众多厂商积极参与Ceph社区的建设。咱们相信Ceph的明天会更美好,并且应该是比OpenStack的发展还要更美好!”云计算
做者:孙浩峰
原文:blog.csdn.net/sunhf_csdn/…