近2年Docker很是的火热,各位开发者巴不得把全部的应用、软件都部署在Docker容器中,可是您肯定也要把数据库也部署的容器中吗?这个问题不是子虚乌有,由于在网上可以找到不少各类操做手册和视频教程,这里整理了一些数据库不适合容器化的缘由供你们参考,同时也但愿你们在使用时可以谨慎一点。目前为止将数据库容器化是很是不合理的,可是容器化的优势相信各位开发者都尝到了甜头,但愿随着技术的发展可以更加完美的解决方案出现。docker
不要将数据储存在容器中,这也是 Docker 官方容器使用技巧中的一条。容器随时能够中止、或者删除。当容器被rm掉,容器里的数据将会丢失。为了不数据丢失,用户可使用数据卷挂载来存储数据。可是容器的 Volumes 设计是围绕 Union FS 镜像层提供持久存储,数据安全缺少保证。若是容器忽然崩溃,数据库未正常关闭,可能会损坏数据。另外,容器里共享数据卷组,对物理机硬件损伤也比较大。即便你要把 Docker 数据放在主机来存储 ,它依然不能保证不丢数据。使用当前的存储驱动程序,Docker 仍然存在不可靠的风险。若是容器崩溃并数据库未正确关闭,则可能会损坏数据。数据库
你们都知道,MySQL 属于关系型数据库,对IO要求较高。当一台物理机跑多个时,IO就会累加,致使IO瓶颈,大大下降 MySQL 的读写性能。在一次Docker应用的十大难点专场上,某国有银行的一位架构师也曾提出过:“数据库的性能瓶颈通常出如今IO上面,若是按 Docker 的思路,那么多个docker最终IO请求又会出如今存储上面。如今互联网的数据库可能是share nothing的架构,可能这也是不考虑迁移到 Docker 的一个因素吧”。安全
针对性能问题也有相应方案解决
**网络
若是使用Docker 跑 MySQL,数据库程序与数据须要进行分离,将数据存放到共享存储,程序放到容器里。若是容器有异常或 MySQL 服务异常,自动启动一个全新的容器。另外,建议不要把数据存放到宿主机里,宿主机和容器共享卷组,对宿主机损坏的影响比较大。架构
Docker 里部署轻量级或分布式数据库,Docker 自己就推荐服务挂掉,自动启动新容器,而不是继续重启容器服务。并发
对于IO要求比较高的应用或者服务,将数据库部署在物理机或者KVM中比较合适。目前TX云的TDSQL和阿里的Oceanbase都是直接部署在物理机器,而非Docker 。分布式
要理解 Docker 网络,您必须对网络虚拟化有深刻的了解。数据库须要专用的和持久的吞吐量,以实现更高的负载。未解决的 Docker 网络问题在1.9版本依然没有获得解决。把这些问题放在一块儿,容器化使数据库容器很难管理。你须要花多少时间解决 Docker 网络问题?将数据库放在专用环境不会更好吗?节省时间来专一于真正重要的业务目标。布局
在 Docker 中打包无状态服务是很酷的,能够实现编排容器并解决单点故障问题。可是数据库呢?将数据库放在同一个环境中,它将会是有状态的,并使系统故障的范围更大。下次您的应用程序实例或应用程序崩溃,可能会影响数据库。性能
知识点: 在 Docker 中水平伸缩只能用于无状态计算服务,而不是数据库。Docker 快速扩展的一个重要特征就是无状态,具备数据状态的都不适合直接放在 Docker 里面,若是 Docker 中安装数据库,存储服务须要单独提供。目前,TX云的TDSQL(金融分布式数据库)和阿里云的Oceanbase(分布式数据库系统)都直接运行中在物理机器上,并不是使用便于管理的 Docker 上。测试
资源隔离方面,Docker 确实不如虚拟机KVM,Docker是利用Cgroup实现资源限制的,只能限制资源消耗的最大值,而不能隔绝其余程序占用本身的资源。若是其余应用过渡占用物理机资源,将会影响容器里 MySQL 的读写效率。须要的隔离级别越多,得到的资源开销就越多。相比专用环境而言,容易水平伸缩是Docker的一大优点。然而在 Docker 中水平伸缩只能用于无状态计算服务,数据库并不适用。咱们没有看到任何针对数据库的隔离功能,那为何咱们应该把它放在容器中呢?
大部分人经过共有云开始项目。云简化了虚拟机操做和替换的复杂性,所以不须要在夜间或周末没有人工做时间来测试新的硬件环境。当咱们能够迅速启动一个实例的时候,为何咱们须要担忧这个实例运行的环境?这就是为何咱们向云提供商支付不少费用的缘由。当咱们为实例放置数据库容器时,上面说的这些便利性就不存在了。由于数据不一致,新实例不会与老实例兼容,若是要限制实例使用单机服务,应该让 DB 使用非容器化环境,咱们仅仅须要为计算服务层保留弹性扩展的能力。
常看到 DBMS 容器和其余服务运行在同一主机上。然而这些服务对硬件要求是很是不一样的。数据库(特别是关系型数据库)对 IO 的要求较高。通常数据库引擎为了不并发资源竞争而使用专用环境。若是将你的数据库放在容器中,那么将浪费你的项目的资源。由于你须要为该实例配置大量额外的资源。在公有云,当你须要 34G 内存时,你启动的实例却必须开 64G 内存。在实践中,这些资源并未彻底使用。怎么解决?您能够分层设计,并使用固定资源来启动不一样层次的多个实例。水平伸缩老是比垂直伸缩更好。
针对上面问题是否是说数据库必定不要部署在容器里吗?答案是:并非咱们能够把数据丢失不敏感的业务(搜索、埋点)就能够容器化,利用数据库分片来来增长实例数,从而增长吞吐量。docker适合跑轻量级或分布式数据库,当docker服务挂掉,会自动启动新容器,而不是继续重启容器服务。数据库利用中间件和容器化系统可以自动伸缩、容灾、切换、自带多个节点,也是能够进行容器化的。