进击的 Vulkan 移动开发之 Instance & Device & Queue

Vulkan 开发的系列文章:git

  1. 进击的 Vulkan 移动开发(一)之此生前世
  1. 进击的 Vulkan 移动开发(二)之谈谈对渲染流程的理解

在 Vulkan 的系列文章中出现过以下的图片:github

这张图片很详细的归纳了 Vulkan 中的重要组件以及它们的工做流程,接下来的文章中会针对每一个组件进行学习讲解并配上相关的示例代码,首先是 Instance、Device 和 Queue 组件。api

Instance 组件

在开始建立 Device 等组件以前,须要建立一个 VkInstance 对象。微信

经过 vkCreateInstance 方法建立 VKInstance 对象,如下是函数原型,在 <vulkan.h> 头文件中。架构

// 声明的函数指针的形式
typedef VkResult (VKAPI_PTR *PFN_vkCreateInstance) (const VkInstanceCreateInfo* pCreateInfo, // 提供建立的信息 const VkAllocationCallbacks* pAllocator, // 建立时的回调函数 VkInstance* pInstance);                // 建立的实例
复制代码

<vulkan.h> 的头文件把函数经过 typedef 关键字声明成了函数指针的形式,可能会有点难找。app

在 Vulkan 的 API 中有一些固定的 调用套路函数

  1. 要建立某个对象,先提供一个包含建立信息的对象。
  2. 建立时经过传递引用的方式来传参。

接下来看看这个套路是如何应用在 VKInstance 对象上的。post

vkCreateInstance 函数中看到有个名为 VkInstanceCreateInfo 类型的参数,这就是包含了 VKInstance 要建立的信息。性能

它的参数信息有点多:学习

typedef struct VkInstanceCreateInfo {
    VkStructureType             sType;  // 通常为方法对应的类型
    const void*                 pNext; // 通常为 null 就行了
    VkInstanceCreateFlags       flags;  // 留着之后用的,设为 0 就行了
    const VkApplicationInfo*    pApplicationInfo; // 对应新的一个结构体 VkApplicationInfo
    uint32_t                    enabledLayerCount; // layer 和 extension 用于调试和拓展
    const char* const*          ppEnabledLayerNames;
    uint32_t                    enabledExtensionCount;
    const char* const*          ppEnabledExtensionNames;
} VkInstanceCreateInfo;
复制代码

除了还须要建立一个 VkApplicationInfo 对象,还能够设置 LayerExtension

其中:Layer 是用来错误校验、调试输出的。为了提供性能,其中的方法之一就是减小驱动进行状态、错误校验,而 Vulkan 就把这一层单独抽出来了。

Layer 在整个架构中的位置如上图,Vulkan API 直接和驱动对话,而 Layer 处于应用和 Vulkan API 之间,供开发者进行调试。

另外,Extension 就是 Vulkan 支持的拓展,最典型的就是 Vulkan 的跨平台渲染显示,就是经过拓展来完成的,好比在 Android、Windows 上使用 Vulkan 都须要使用不一样的拓展才能够把内容显示到屏幕上。

关于 LayerExtension 后续再细说。

接着回到 VkApplicationInfo 结构体,也是建立 Instance 的必要参数之一。

typedef struct VkApplicationInfo {
    VkStructureType    sType;
    const void*        pNext;
    const char*        pApplicationName;
    uint32_t           applicationVersion;
    const char*        pEngineName;
    uint32_t           engineVersion;
    uint32_t           apiVersion;
} VkApplicationInfo;
复制代码

它的参数释义就比较容易理解了,设置应用的名称、版本号等,有了它们就能够建立 Instance 对象了,代码能够参考 这里

具体的代码以下:

VkApplicationInfo app_info = {};
    
    app_info.apiVersion = VK_API_VERSION_1_0;
    app_info.applicationVersion = 1;
    app_info.engineVersion = 1;
    app_info.pNext = nullptr;
    app_info.sType = VK_STRUCTURE_TYPE_APPLICATION_INFO;
    app_info.pEngineName = APPLICATION_NAME;
    app_info.pApplicationName = APPLICATION_NAME;

    VkInstanceCreateInfo instance_info = {};
    // type 就是结构体的类型
    instance_info.sType = VK_STRUCTURE_TYPE_INSTANCE_CREATE_INFO;
    instance_info.pNext = nullptr;
    instance_info.pApplicationInfo = &app_info;
    instance_info.flags = 0;
    // Extension and Layer 暂时不用,可空
    instance_info.enabledExtensionCount = 0;
    instance_info.ppEnabledExtensionNames = nullptr;
    instance_info.ppEnabledLayerNames = nullptr;
    instance_info.enabledLayerCount = 0;

    VkResult result = vkCreateInstance(&instance_info, nullptr, &instance);
复制代码

当每调用一个建立函数后,返回的类型都是 VkResult ,只要 VkResult 大于 0 ,那么执行就是成功的。

另外还有个参数是 VkAllocationCallbacks,表示函数调用时的回调,须要传递一个函数指针,在后面的各类调用中都会看到它的身影,若是有用到能够传参,通常为 nullptr 就行了。

关于每一个结构体,它每一个参数的具体释义,靠死记硬背是确定不行的,参考 vkspec.pdf 书籍,里面有对每一个参数、结构体的详细释义。

Device 组件

有了 Instance 组件,就能够建立 Device 组件了,按照调用的套路,确定还会有一个 VkDeviceCreateInfo 的结构体表示 Device 的建立信息。

Device 具体指的是逻辑上的设备,能够说是对物理设备的一个逻辑上的封装,而物理设备就是 VkPhysicalDevice 对象。

在某些状况下,可能会具备多个物理设备,以下图所示,所以要先枚举一下全部的物理设备:

LOGI("enumerate gpu device");
    uint32_t gpu_size = 0;
    // 第一次调用只为了得到个数
    VkResult res = vkEnumeratePhysicalDevices(instance, &gpu_size, nullptr);
复制代码

vkEnumeratePhysicalDevices 方法中,传入的第二个参数为 gpu 的个数,第三个参数为 null,这样的一次调用会返回 gpu 的个数到 gpu_size 变量。

vector<VkPhysicalDevice> gpus;
    gpus.resize(gpu_size);
    // vector.data() 方法转换成指针类型
    // 第二次调用得到全部的数据
    res = vkEnumeratePhysicalDevices(instance, &gpu_size, gpus.data());
复制代码

当再一次调用 vkEnumeratePhysicalDevices 函数时,第三个参数不为 null,而是相应的 VkPhysicalDevice 容器,那么 gpus 会填充 gpu_size 个的 VkPhysicalDevice 对象。

这也算是 Vulkan API 调用的一个 固定套路 了,调用两次来得到数据,在后面的代码中也会常常看到这种方式。

有了 VkPhysicalDevice 对象以后,能够查询 VkPhysicalDevice 上的一些属性,如下函数均可以查询相关信息:

  • vkGetPhysicalDeviceQueueFamilyProperties
  • vkGetPhysicalDeviceMemoryProperties
  • vkGetPhysicalDeviceProperties
  • vkGetPhysicalDeviceImageFormatProperties
  • vkGetPhysicalDeviceFormatProperties

在这里须要用到的属性是 QueueFamilyProperties ,得到该属性的方法调用方式和得到 VkPhysicalDevice 数据方式同样,也是一个两次调用。

若是有设备有多个 GPU,那么这里取第一个来获取它的相关属性:

// 第一次调用,得到个数
    uint32_t queue_family_count = 0;
    vkGetPhysicalDeviceQueueFamilyProperties(gpus[0], &queue_family_count, nullptr);
    assert(queue_family_count != 0);
    
    // 第二次调用,得到实际数据
    vector<VkQueueFamilyProperties> queue_family_props;
    queue_family_props.resize(queue_family_count);
    vkGetPhysicalDeviceQueueFamilyProperties(gpus[0], &queue_family_count, queue_family_props.data());
    assert(queue_family_count != 0);
复制代码

QueueFamilyProperties 的结构体含义以下:

typedef struct VkQueueFamilyProperties {
    VkQueueFlags    queueFlags;      // 标识位:表示 Queue 的功能
    uint32_t        queueCount;         
    uint32_t        timestampValidBits;
    VkExtent3D      minImageTransferGranularity;
} VkQueueFamilyProperties;
复制代码

其中:queueFlags 表示该 Queue 的能力,有的 Queue 是用来渲染图像的,这个和咱们的使用最为密切,还有的 Queue 是用来计算的。

具体的 Flag 标识以下:

typedef enum VkQueueFlagBits {
    VK_QUEUE_GRAPHICS_BIT = 0x00000001,         // 图像相关
    VK_QUEUE_COMPUTE_BIT = 0x00000002,          // 计算相关
    VK_QUEUE_TRANSFER_BIT = 0x00000004,
    VK_QUEUE_SPARSE_BINDING_BIT = 0x00000008,
    VK_QUEUE_FLAG_BITS_MAX_ENUM = 0x7FFFFFFF
} VkQueueFlagBits;
typedef VkFlags VkQueueFlags;
复制代码

通常来讲,咱们用的是 queueFlagsVK_QUEUE_GRAPHICS_BIT 标识位的 Queue

那么 Queue 到底是什么?

物理设备可能会有多个 Queue,不一样的 Queue 对应不一样的特性。

在文章最开始的图中能够看到,Command-buffer 是提交到了 QueueQueue 再提交给 Device 去执行。Queue 能够当作是应用程序和物理设备沟通的桥梁,咱们在 Queue 上提交命令,而后再交由 GPU 去执行。

回到本小节的内容,建立 Device 组件,它的函数指针形式以下:

// 建立 Device 的函数指针
typedef VkResult (VKAPI_PTR *PFN_vkCreateDevice) (VkPhysicalDevice physicalDevice, // 物理设备 const VkDeviceCreateInfo* pCreateInfo, // 调用套路里面的 CreateInfo const VkAllocationCallbacks* pAllocator, VkDevice* pDevice);                   // 要建立的 Device 类
复制代码

建立一个 Device 对象,不只须要指定具体的物理设备 VkPhysicalDevice,另外还须要该物理设备上的 Queue 相关信息。

VkDeviceCreateInfo 结构体中须要一个参数是 VkDeviceQueueCreateInfo ,它的建立以下:

// 建立 Queue 所需的相关信息
    VkDeviceQueueCreateInfo queue_info = {};
    // 找到属性为 VK_QUEUE_GRAPHICS_BIT 的索引
    bool found = false; 
    for (unsigned int i = 0; i < queue_family_count; ++i) {
        if (queue_family_props[i].queueFlags & VK_QUEUE_GRAPHICS_BIT) {
            queue_info.queueFamilyIndex = i;
            found = true;
            break;
        }
    }

    float queue_priorities[1] = {0.0};
    // 结构体的类型
    queue_info.sType = VK_STRUCTURE_TYPE_DEVICE_QUEUE_CREATE_INFO;
    queue_info.pNext = nullptr;
    queue_info.queueCount = 1;
    // Queue 的优先级
    queue_info.pQueuePriorities = queue_priorities;
复制代码

接下来就能够完成 Queue 的建立:

// 建立 Device 所需的相关信息类
    VkDeviceCreateInfo device_info = {};

    device_info.sType = VK_STRUCTURE_TYPE_DEVICE_CREATE_INFO;
    device_info.pNext = nullptr;
    // Device 所需的 Queue 相关信息
    device_info.queueCreateInfoCount = 1;   // Queue 个数
    device_info.pQueueCreateInfos = &queue_info;    // Queue 相关信息
    // Layer 和 Extension 暂时为空,不影响运行,后续再补上
    device_info.enabledExtensionCount = 0;
    device_info.ppEnabledExtensionNames = NULL;
    device_info.enabledLayerCount = 0;
    device_info.ppEnabledLayerNames = NULL;
    device_info.pEnabledFeatures = NULL;
    
    res = vkCreateDevice(gpus[0], &device_info, nullptr, &device);
复制代码

Queue 组件

完成了 Device 建立以后,Queue 的建立也简单多了,直接调用以下函数就行了:

typedef void (VKAPI_PTR *PFN_vkGetDeviceQueue) (VkDevice device, // 建立的 Device 对象 uint32_t queueFamilyIndex, // queueFlags 为 VK_QUEUE_GRAPHICS_BIT 的索引 uint32_t queueIndex, VkQueue* pQueue);       // 要建立的 Queue

// 代码示例
vkGetDeviceQueue(info.device, info.graphics_queue_family_index, 0, &info.queue);

复制代码

组件销毁

完成了 InstanceDeviceQueue 组件的建立以后,还有一件要作的事情就是释放它们,销毁组件。

按照先进后出的方式进行销毁,Instance 最早建立反而最后销毁,和 Device 相关联的 QueueDevice 销毁了,Queue 也随之销毁了。

// 销毁 Device
    vkDestroyDevice(info.device, nullptr);
    // 销毁 Instance
    vkDestroyInstance(info.instance, nullptr);
复制代码

参考

这里有一些不错的参考地址和书籍:

  1. www.zhihu.com/people/snow…
  2. www.zhihu.com/people/chen…

也能够参考个人项目实践代码:

github.com/glumes/vulk…

以上是我的的学习经验,仅供参考,有讲的不对之处,欢迎指出,也能够加我微信一块儿交流学习: zh_ying_13 (备注博客).

有相关工做机会的求带入坑~~~

总结

敲一遍上述的代码,会发现 Vulkan 在 API 调用上仍是有迹可循的,重点是要理解了每一个参数的含义,多结合官方的文档来学习、实践、

欢迎关注微信公众号:【纸上浅谈】,得到最新文章推送~~~

扫码关注
相关文章
相关标签/搜索