1、热迁移的排错经历node
先来看下cpu型号,从/proc/cpuinfo中能够看出全部cpu型号版本是同样的
ios
经过nova live-migration --debug <instance-xxx> <node-xxxx>命令行迁移,能够看到报错信息api
经过nova-compute log错误信息定位代码服务器
再下面就到libvirt.py了ide
经过这个api,看不出具体错误信息,多是跟flags是0有关系。ui
经过debug代码,保存cpu xml信息到某个文件spa
经过virsh接口能够看到错误, 舒了一口气!
命令行
同样的cpu不同的cpu features,亮瞎我了!debug
对比宿主机的cpu flags,真的差了一个monitor特性,后面查到是曙光服务器的bios版本不一致,涨姿式了!3d
kvm是支持实例以指定的cpu启动,经过在/etc/nova/nova.conf中配置cpu_mode和cpu_model
[libvirt]
cpu_mode=custom
cpu_model=kvm64
重启openstack-nova-compute服务生效,若是要对已存在的实例生效,需对其硬重启。 在cpu配置为kvm64下 window 2012R2 vm启动会有问题,症状跟在这里描述的同样:https://bugzilla.redhat.com/show_bug.cgi?id=1086319
对应的qemu、libvirt版本:
qemu: 1.5.3
libvirt: 1.2.17
2、冷迁移的排错经历
若是nova-scheduler节点nova.conf中的scheduler_default_filters配置项有AvailabilityZoneFilter这个配置,而后改了availability-zone(默认为nova),改成其它名字。 冷迁移的时候走调度,结果AvailabilityZoneFilter过滤后没有匹配的主机了。
class AvailabilityZoneFilter(filters.BaseHostFilter): """Filters Hosts by availability zone. Works with aggregate metadata availability zones, using the key 'availability_zone' Note: in theory a compute node can be part of multiple availability_zones """ # Availability zones do not change within a request run_filter_once_per_request = True def host_passes(self, host_state, filter_properties): spec = filter_properties.get('request_spec', {}) props = spec.get('instance_properties', {}) availability_zone = props.get('availability_zone') if not availability_zone: #第一次建立虚拟机的时候,还有availability_zone,返回是true return True metadata = utils.aggregate_metadata_get_by_host( #对已建立好的虚拟机;有两种判断 host_state, key='availability_zone') if 'availability_zone' in metadata: #一、给主机聚合设置元数据 hosts_passes = availability_zone in metadata['availability_zone'] host_az = metadata['availability_zone'] else: hosts_passes = availability_zone == CONF.default_availability_zone #二、跟default_availability_zone(默认也为nova)配置项比较 host_az = CONF.default_availability_zone if not hosts_passes: LOG.debug("Availability Zone '%(az)s' requested. " "%(host_state)s has AZs: %(host_az)s", {'host_state': host_state, 'az': availability_zone, 'host_az': host_az}) return hosts_passes