Read the fucking source code!
--By 鲁迅A picture is worth a thousand words.
--By 高尔基说明:linux
https://www.cnblogs.com/LoyenWang/
先来两段前戏。数据结构
AI的世界,程序的执行再也不冰冷,CPU对a.out
说,hello啊,world已经ok啦,下来return吧!
架构
既然要说CPU的虚拟化,那就先简要介绍一下CPU的工做原理:app
取指-译码-执行-访存-写回
,就是典型的指令Pipeline操做;Control Unit
:CPU的指挥中心,协调数据的移动;ALU
:运算单元,执行CPU内部全部的计算;Register
:寄存器和Cache
,都算是CPU内部的存储单元,其中寄存器可用于存储须要被译码和执行的指令、数据、地址等;context
指的就是CPU寄存器值;在硬件支持虚拟化以前,Qemu纯软件虚拟化方案,是经过tcg(tiny code generator)
的方式来进行指令翻译,翻译成Host处理器架构的指令来执行。硬件虚拟化技术,是让虚拟机能直接执行在Host CPU上,让Host CPU直接来执行虚拟机,结合CPU的实际工做原理,应该怎么来理解呢?来张图:函数
pc
寄存器获取下一条执行指令,进行取指译码执行等操做,所以给定CPU一个Context,天然就能控制其执行某些代码;既然都讲CPU了,那就捎带介绍下ARMv8的寄存器吧:工具
EL3
如下,AArch32
与AArch64
寄存器对应关系;AArch64
中,总共31个通用寄存器,64bit的为X0-X30,32bit的为W0-W30;ELR_ELx
;2)各个EL的栈指针SP_ELx
;3)CPU的状态相关寄存器;PSTATE
:AArch32
时是经过CPSR
来获取,在AArch64
中,使用PSTATE
,PSTATE
不是一个寄存器,它表示的是保存当前CPU状态信息的一组寄存器或一些标志信息的统称;好了,ARMv8的介绍该打住了,不然要跑偏了。。。测试
好了啦,前戏结束,开始直奔主题吧。spa
无论你说啥,我上来就是一句中国万岁,对不起,跑题了。我上来就是一张Qemu初始化流程图:线程
vcpu
相关部分;除了找到了qemu_init_vcpu
的入口,这张图好像跟本文的vcpu的虚拟化关系不是很大,无论了,就算是给后续的Qemu分析打个广告吧。翻译
qemu_init_vcpu
的入口,顺着这个qemu_init_vcpu
就能找到与底层KVM模块交互的过程;因此,接力棒甩到了KVM内核模块。
来一张前文的图:
ioctl
来进行控制;Qemu
中设置KVM_CREATE_VCPU
,将触发kvm_vm_ioctl_create_vcpu
的执行,完成vcpu的建立工做;kvm_vcpu
结构,而且对该结构中的字段进行初始化;struct kvm_run
,分配一页内存,应用层会调用mmap来进行映射,而且会从该结构中获取到虚拟机的退出缘由;kvm_arch_vcpu_create
主要完成体系架构相关的初始化,包括timer,pmu,vgic等;create_hyp_mappings
将kvm_vcpu
结构体创建映射,以便在Hypervisor
模式下能访问该结构;create_vcpu_fd
注册了kvm_vcpu_fops
操做函数集,针对vcpu进行操做,Qemu
中设置KVM_ARM_VCPU_INIT
,将触发kvm_arch_vcpu_ioctl_vcpu_init
的执行,完成的工做主要是vcpu的核心寄存器,系统寄存器等的reset操做,此外还包含了上层设置下来的值,放置在struct kvm_vcpu_init
中;Qemu
中为每个vcpu建立一个用户线程,完成了vcpu的初始化后,便进入了vcpu的运行,而这是经过kvm_cpu_exec
函数来完成的;kvm_cpu_exec
函数中,调用kvm_vcpu_ioctl(,KVM_RUN,)
来让底层的物理CPU进行运行,而且监测VM的退出,而这个退出缘由就是存在放在kvm_run->exit_reason
中,也就是上文中提到过的应用层与底层交互的机制;用户层经过KVM_RUN
命令,将触发KVM模块中kvm_arch_vcpu_ioctl_run
函数的执行:
__guest_enter
函数完成最终的context切换,进入Guest的执行,当Guest退出时,fixup_guest_exit
将会处理exit_code
,判断是否继续返回Guest执行;handle_exit
来处理异常退出,根据kvm_get_exit_handler
去查询异常处理函数表对应的处理函数,最终进行执行处理;简要介绍一下:
Hello, world
打印;鲁迅在1921年的时候,说过这么一句话:Talk is cheap, show me the code
。
tiny_kernel.S
:start: /* Hello */ mov $0x48, %al outb %al, $0xf1 mov $0x65, %al outb %al, $0xf1 mov $0x6c, %al outb %al, $0xf1 mov $0x6c, %al outb %al, $0xf1 mov $0x6f, %al outb %al, $0xf1 mov $0x2c, %al outb %al, $0xf1 /* world */ mov $0x77, %al outb %al, $0xf1 mov $0x6f, %al outb %al, $0xf1 mov $0x72, %al outb %al, $0xf1 mov $0x6c, %al outb %al, $0xf1 mov $0x64, %al outb %al, $0xf1 mov $0x0a, %al outb %al, $0xf1 hlt
tiny_qemu.c
:#include <stdio.h> #include <string.h> #include <unistd.h> #include <assert.h> #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> #include <sys/ioctl.h> #include <linux/kvm.h> #include <sys/mman.h> #define KVM_DEV "/dev/kvm" #define TINY_KERNEL_FILE "./tiny_kernel.bin" #define PAGE_SIZE 0x1000 int main(void) { int kvm_fd; int vm_fd; int vcpu_fd; int tiny_kernel_fd; int ret; int mmap_size; struct kvm_sregs sregs; struct kvm_regs regs; struct kvm_userspace_memory_region mem; struct kvm_run *kvm_run; void *userspace_addr; /* open kvm device */ kvm_fd = open(KVM_DEV, O_RDWR); assert(kvm_fd > 0); /* create VM */ vm_fd = ioctl(kvm_fd, KVM_CREATE_VM, 0); assert(vm_fd >= 0); /* create VCPU */ vcpu_fd = ioctl(vm_fd, KVM_CREATE_VCPU, 0); assert(vcpu_fd >= 0); /* open tiny_kernel binary file */ tiny_kernel_fd = open(TINY_KERNEL_FILE, O_RDONLY); assert(tiny_kernel_fd > 0); /* map 4K into memory */ userspace_addr = mmap(NULL, PAGE_SIZE, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0); assert(userspace_addr > 0); /* read tiny_kernel binary into the memory */ ret = read(tiny_kernel_fd, userspace_addr, PAGE_SIZE); assert(ret >= 0); /* set user memory region */ mem.slot = 0; mem.flags = 0; mem.guest_phys_addr = 0; mem.memory_size = PAGE_SIZE; mem.userspace_addr = (unsigned long)userspace_addr; ret = ioctl(vm_fd, KVM_SET_USER_MEMORY_REGION, &mem); assert(ret >= 0); /* get kvm_run */ mmap_size = ioctl(kvm_fd, KVM_GET_VCPU_MMAP_SIZE, NULL); assert(mmap_size >= 0); kvm_run = (struct kvm_run *)mmap(NULL, mmap_size, PROT_READ | PROT_WRITE, MAP_SHARED, vcpu_fd, 0); assert(kvm_run >= 0); /* set cpu registers */ ret = ioctl(vcpu_fd, KVM_GET_SREGS, &sregs); assert(ret >= 0); sregs.cs.base = 0; sregs.cs.selector = 0; ret = ioctl(vcpu_fd, KVM_SET_SREGS, &sregs); memset(®s, 0, sizeof(struct kvm_regs)); regs.rip = 0; ret = ioctl(vcpu_fd, KVM_SET_REGS, ®s); assert(ret >= 0); /* vcpu run */ while (1) { ret = ioctl(vcpu_fd, KVM_RUN, NULL); assert(ret >= 0); switch(kvm_run->exit_reason) { case KVM_EXIT_HLT: printf("----KVM EXIT HLT----\n"); close(kvm_fd); close(tiny_kernel_fd); return 0; case KVM_EXIT_IO: putchar(*(((char *)kvm_run) + kvm_run->io.data_offset)); break; default: printf("Unknow exit reason: %d\n", kvm_run->exit_reason); break; } } return 0; }
为了代表我没有骗人,上一张在Ubuntu16.04的虚拟机上运行的结果图吧:
草草收工吧。
ARMv8-A Architecture Overview
ARMv8 Techinology Preview
Arm Architecture Reference Manual, Armv8, for Armv8-A architecture profile
Virtual lockstep for fault tolerance and architectural vulnerability analysis
欢迎关注我的公众号,不按期分享技术文章: