云成本管理方法论(四)——云优化管理之管理措施

咱们将在此篇文章中继续讨论云优化管理中的管理措施。数据库

管理措施

问题类型

由于断定规则分析中的断定结果较分散,为便于后继的分析和使用,咱们将断定结果进行分类,不一样的类别称为“问题类型”。缓存

在断定结果中,“数据错误”属于 IaaS 平台问题,此处不作考虑,另外,“资源不足”和“快照或备份不足”属于性能及容灾优化而非成本优化的范畴,也不作考虑。因此所有的问题类型以下:网络

  • 闲置资源:1)[组合]无父资源;2)[聚合]父资源已中止;3)[聚合]无子资源。
  • 遗留资源:1)[快照关联]源资源不存在。
  • 过分冗余:1)快照或备份过多。
  • 预留不足:1)预留资源不足。
  • 预留过剩:1)预留资源低利用率。
  • 低利用率:1)资源低利用率。

优化管理问题类型

须要注意的是,有些问题类型的“问题”多是用户有意的处理方式,因此并非真正的须要优化的问题。咱们称这种既可能属于正常使用方式也可能属于未合理使用的问题类型为弱问题类型。在实践中,须要对弱问题类型增长一些辅助断定条件,以减小不须要优化的误判“问题”。函数

由于问题类型是优化管理中的一个核心概念,咱们有必要总结一下其得到方式:性能

以 “资源状态 + 资源关系状态” 或 “资源指标 + 指标合理范围” 做为输入信息,通过条件匹配或比较运算,从而得出问题类型优化

问题类型断定

固然,除了前面分析的基本的断定规则和问题类型,对于某些资源类型也会有其特殊的问题类型及断定规则,这将在分析具体资源时来补充。操作系统

事前管理

事前管理的主要工做是制定断定规则,在前面“断定规则”章节已作了通常性的说明,下面针对具体状况再作一些补充。设计

- 闲置资源

闲置资源指资源处于“活动中”状态,但并无发挥做用。如闲置资源定义中所列举,一种资源未发挥做用有多种可能,多是自身未与可以使用它的资源进行关联,也多是它所从属的资源未被使用,也多是它并未包含任何具备实际服务能力的资源。同时,基于闲置资源的这一本质理解,咱们也能够后继将其余的断定结果也纳入此问题类型。3d

- 遗留资源

遗留资源是指存在快照资源,但生成快照资源的源资源已再也不存在。此情形多是用户有意为之,也多是由于疏忽遗忘,尤为是“遗留”时间很长的遗留资源,因此它属于弱问题类型。对于此类问题的断定须要增长如“遗留时长”等辅助断定条件。对象

- 预留不足

预留不足是指知足特定预留匹配规则的实例资源用量大于预留资源用量。断定预留不足的一个关键条件是预留匹配规则,此匹配规则通常随资源类型的不一样而不一样,下面仅列举 AWS 云三种主要预留资源与其实例资源的匹配规则:

  • 虚机(EC2):可用区、租用方式、实例类型和操做系统四个属性彻底匹配1
  • 关系型数据库(RDS):是否跨可用区部署、实例类型和数据库引擎(及受权方式)三个属性彻底匹配。
  • 缓存(ElastiCache):实例类型和缓存引擎两个属性彻底匹配。

另外,如前面说明,不能仅由于瞬时或短期的预留资源少于实例资源就将其断定为预留不足。由于预留资源的购买时间单位都较长,通常都在 1 年以上,因此计算“预留不足状态”平均时长的时间单位选择也会较长,通常可选择月为单位。好比,在最近 30 天中,若是有必定数量的实例资源在 50% 以上的时间中都处于预留不足的状态,则可认为这些资源有预留不足的问题。固然,由于有些预留资源的匹配规则比较复杂(好比 AWS 虚机预留实例中的大小灵活性规则)致使预留与实例资源之间实际是一种多对多的动态匹配,以及由于咱们优化的目的是节省成本,因此还必须根据预留资源与实例资源之间的价格差来肯定合理的“预留不足状态”平均时长,因此对于预留不足实际的断定有一个很是复杂的逻辑。

- 预留过剩

预留过剩是指知足特定预留匹配条件的实例资源用量小于预留资源用量。预留过剩的断定方法与预留不足彻底相同,仅在两种资源的用量比较关系上有差异。

- 过分冗余

对于过分冗余类型,首先须要理解冗余自己并非问题,而“过分”冗余才是问题。但何种程度才算过分,须要参考商务策略或业务需求来得出。简化来讲,恰好知足商务或业务的须要就是合适,而超出这些须要就是过分。对于过分冗余的断定,可根据资源类型、备份类型、备份数据的大小及资源数据的重要性(好比开发环境和生产环境数据库重要性的差别)等实际因素来肯定其备份数的合理范围。

好比,对于虚机镜像,通常只须要 1 份备份;对于开发环境的数据库快照,可设置 0~1 份备份,而对于生产环境,通常须要保留(7 天) 7 份备份;对于对象存储(如 AWS S3),可根据数据的数量和重要性,采用低冗余或标准存储类型。

- 低利用率

资源低利用率是指处于活动中状态的此类资源的用量大于业务所需。但一种资源每每会具备多种指标,因此通常不能经过单一指标的值来断定一种资源是否低利用率。与此同时,对于断定一种资源是否低利用率应选择哪些指标也每每跟业务需求及软件设计有关。因此在咱们说某一种资源低利用率时通常并无一个确切的概念。所以,在设计成本优化管理软件时,对于资源低利用率的断定规则,应提供必定的可定制能力。

另外,资源指标的合理范围通常是行业或业务经验值,没有确切的参考标准。在实践中,通常会由云优化管理产品的提供商对行业经验值整理概括提出,或是企业人员根据自身经验或参考资料设定。同时,不论是来源于云管理产品提供商仍是企业人员,随着应用和实践经验的不断积累,这个合理范围每每也会不断调整变化。

事中管理

优化管理的事中管理措施包括发现(违规)问题、报告问题及处理问题。前两项工做参照通用管理模型中说明便可,这里仅对处理问题措施即优化措施进行说明。

- 闲置资源

闲置资源优化措施:中止或终止资源。

对此类问题的处理需注意下面两点:

  1. 有些闲置资源,好比已中止的虚机挂载的存储卷,多是由于被疏忽,也多是充当的备份的做用,若是是后者,直接终止此资源是不恰当的,因此对于闲置资源要区分实际状况肯定是否实施优化。
  2. 在中止某些闲置资源时,可能会致使其子资源也成为闲置资源,对于此状况可一并处理。

- 遗留资源

遗留资源优化措施:中止或终止资源。

因为遗留资源是一种弱问题类型,除了在断定时要增长辅助断定条件外,在执行优化措施前,最好应首先由资源实际使用者确承认否执行优化措施。

- 过分冗余

过分冗余优化措施:中止或终止过分冗余部分的资源。

如前所述,冗余自己并非问题,因此这里的优化措施只是消除冗余中“过分”的那一部分,而非消除所有的冗余资源。

- 预留不足

预留不足优化措施:修改现有预留或实例资源匹配属性或购买预留实例。

预留资源不足有两种可能缘由,一种是启动的实例资源没有匹配上已购买的预留资源,另外一种是已购买的预留资源不足。若是是前者,则应优先考虑修改预留资源的匹配属性以实现匹配,若是没法经过修改预留资源属性实现,再考虑修改实例资源匹配属性2;若是是后者,再考虑购买新的预留资源。

- 预留过剩

预留过剩优化措施:修改现有预留或实例资源匹配属性或出售预留实例。

预留资源过剩也有两种可能缘由,一种是启动的实例资源没有匹配上已购买的预留资源,另外一种是过量购买了预留资源。若是是前者,应优先考虑修改预留资源的匹配属性以实现匹配,若是没法经过修改预留资源属性实现,再考虑修改实例资源匹配属性;若是是后者,可考虑出售过剩的预留资源。

从预留不足和预留过剩两种问题的缘由能够看到,实例与预留资源不匹配可能同时引发预留不足和预留过剩,因此多数状况下,在发生预留不足或过剩的问题时,应先仔细考察两种资源的匹配状况来消除这两类问题。同时,若是正确地按照此方式来进行优化,也会避免预留资源绝对过剩的状况(必须经过出售预留资源来优化)。可是,回到实际状况来看,因为前面在“预留不足”问题类型中关于预留资源匹配逻辑的说明,靠人工是很难准确完成两种资源的匹配的,也就是说此类优化通常都经过云管理平台(CMP)来实现。

- 低利用率

低利用率优化措施:中止或终止过剩的资源。

因为不一样资源以及相同资源在不一样业务中都会有不一样的低利用率断定规则,因此具体的资源低利用率种类很是多样,在实施优化时也须要根据不一样的种类采起不一样的措施。

常见的低利用率种类有虚机资源数量过剩,缓存资源内存过剩,网络带宽过剩,数据库存储过剩,存储卷容量过剩,存储卷 IOPS 过剩,存储卷吞吐量过剩等等。因为低利用率问题种类众多,因此咱们会在后面文章中分资源专题分析,这里仅就 AWS 云平台中“存储卷 IOPS 过剩”作一个示例。

假设用户当前使用的“预配置 IOPS”(标识为“io1”)的卷类型,则要下降 IOPS 有两种方法,一种是保持现有卷类型,并将预配置 IOPS 的值下降到合适值(同时可能伴随减小卷大小);一种是将卷类型变为通用卷(标识为“gp2”),并修改卷的大小,使其基准 IOPS 达到知足需求的合适值。若是仅从下降 IOPS 这一指标值的角度,这两种方法是等价的。但须要注意的是,咱们对存储卷 IOPS 过剩这一问题优化的根本目的是节省成本,而非仅是表面上下降这一指标值。咱们知道,存储卷的成本由三个因素决定:卷类型,卷大小和预配置 IOPS(对于通用卷类型,不包含此因素)。因此咱们须要在给定预配置 IOPS 或基准 IOPS 取值的状况下,经过调整卷类型和卷大小两个因素,来寻求存储卷成本的最小值。

事实上,卷类型、卷大小、 IOPS 值及卷成本之间确实存在肯定的函数关系,所以上述求最小值的目标是能够实现的。但由于这些函数关系都是非线性的,因此须要经过较复杂的验算才能得出。考虑到此篇文章的重点是研究方法论,因此这里将不作详细的验算,但为了代表其复杂性,下面给出卷成本与卷类型及卷大小:

EBS 年成本 vs EBS 大小

以及通用卷类型基准 IOPS 与卷大小的函数曲线:

EBS 基准 IOPS vs EBS 大小

实际上,要完成上述的验算,实际还须要提供预配置 IOPS 与其成本(此成本独立于卷大小产生的成本)的函数关系。由于这一关系是连续的和线性的,比较简单,因此再也不给出函数曲线图。

过后管理

同通用管理模型中说明。

下期预告

下期文章:《云成本管理方法论(五)——优化效果测量模型》,将给出一些不一样的优化效果测量模型并分析其优缺点。在实践中可根据具体应用场景来作选择。


  1. 严格来讲,EC2 预留实例有三种预留类型:标准 RI、可转换 RI 和计划 RI。这里只给出了标准 RI 可用区范围(相对于区域范围)的匹配规则。对于完整的匹配规则,咱们将在后面虚机相关的专题文章中讨论。

  2. 相较于修改预留资源,修改实例资源的匹配属性须要更繁复的操做,并存在必定风险,因此优先应选择前者。

相关文章
相关标签/搜索