VMware Fault-Tolerant Virtual Machine 论文总结

  • Desire服务器

    • 但愿搞一个Fault-Tolerant的Machine(Computer)
    • 是从计算机角度出发的FT(对计算机整个运行状态的replication),而不是仅仅是应用层次的FT,
  • Is Worthy?网络

    • 虚拟机相比直接在物理机层面更不重视硬件特性,适用范围更广。
    • 比state transfer这种方式要好,开销更小,可是实现相比更加复杂
  • Apporaches of Replicationserver

    • state transfer
      • 整个物理状态的传输(好比内存、磁盘)等等
    • replicated state machine
      • 控制开始状态相同,传输外部操做+额外的控制信息
      • 本质是让二者的内部操做相同
  • What state?事件

    • 内存中的全部内容和寄存器状态,而不是应用层级别
      • 缺点:开销大
      • 优势:对上层应用的支持强(要求低)
    • 经过packet来传输
  • Modelip

    • replicated state machine
  • 不肯定事件内存

    • Input(输入方式、中断)
      • 设定输入只来自网络
      • 数据包中的内容和中断的时机
        • primary发送发生中断的指令位置,backup接收中断,为了保证正确性,backup须要保证状态总落后于primary
    • weird instructions
      • 好比一些产生随机数,读取本机mac地址(等惟一性结果)
      • 这类指令的结果,backup只能经过primary转发得到相关结果来保证一致性
    • multi-core
      • 多核指令执行顺序不一样
      • 还没有解决
  • Output rules同步

    • 只有当全部的backup接收到消息以后,primary才能output
      • 避免了主机接收到消息后output,可是主机以后死掉了,并且因为网络缘由发送给backup的消息也丢了,而致使的backup与primary状态不一致
  • Test-and-Set server虚拟机

    • 决定在发送故障时哪一个服务器go live, 采用cas原理
    • 避免互相认为对方下线,并产生“split brain” 现象
  • 同步程度it

    • 部分延迟,backup是略延迟于主VM的
  • Cut-over(Client 应该在主机宕机以后,知道去哪一个backup上访问 )io

    • backup上线的时候,会模拟主机的一些特性,好比ip,mac等,对外,client不会察觉cut-over
  • Extra Ouputs

    • backup上线的时候,可能会重复输出一些以前主VM已经输出的信息。由于backup没法确认主VM是在output以后下线,仍是在output以前下线的。
  • 支持运行时new replica

相关文章
相关标签/搜索