本系列文章是对 metalkit.org 上面MetalKit内容的全面翻译和学习.html
今天咱们关注一下使用GPU
时的内存管理.Metal
框架将内存资源定义为MTLBuffer
对象,它是分配的无类型,无格式的内存(任何数据类型),MTLTexture
对象则是分配的格式化内存来保存图片数据.咱们在本文中只关注缓冲器.git
建立MTLBuffer
对象时有三种选项:github
MTLBuffer
对象并分配一块新内存.让咱们建立一组缓冲器,看看数据是如何被传递到GPU
的,及如何回传给CPU
.咱们首先建立一块缓冲器给输入和输出数据,并给它们初始化一些值:swift
let count = 1500
var myVector = [Float](repeating: 0, count: count)
var length = count * MemoryLayout< Float >.stride
var outBuffer = device.makeBuffer(bytes: myVector, length: length, options: [])
for (index, value) in myVector.enumerated() { myVector[index] = Float(index) }
var inBuffer = device.makeBuffer(bytes: myVector, length: length, options: [])
复制代码
新的MemoryLayout< Type >.stride语法在Swift 3
被引入,来替代老的strideof(Type)
函数.同时,由于内存排列的缘由咱们用.stride
替代了.size
.stride是指针增加时移动的字节数.下一步是把咱们缓冲器告诉命令编码器:数组
encoder.setBuffer(inBuffer, offset: 0, at: 0)
encoder.setBuffer(outBuffer, offset: 0, at: 1)
复制代码
注意: <Metal最佳实践指南>指出当咱们的数据小于4KB(例如一个千位的浮点数)时就避免建立缓冲器.在本例中咱们应该使用setBytes()函数来代替建立缓冲器.
性能优化
最后一步是读取GPU
经过contents() 函数返回的数据,绑定内存数据到咱们的输出缓冲器上:框架
let result = outBuffer.contents().bindMemory(to: Float.self, capacity: count)
var data = [Float](repeating:0, count: count)
for i in 0 ..< count { data[i] = result[i] }
复制代码
Metal
资源必须被配置好,以便快速内存访问和驱动器性能优化.资源的储存模式容许咱们定义缓冲器和纹理的储存位置和访问权限.若是你再看一眼上面咱们建立缓冲器的地方,咱们使用了默认([])的储存模式.ide
全部的iOS
和tvOS
设备支持unified memory model统一内存模型,它可让CPU
和GPU
共享系统内存,而macOS
设备支持discrete memory model离散内存模型即GPU
拥有本身的内存.在iOS
和tvOS
中,Shared模式(MTLStorageModeShared
)定义了系统内存能够被CPU
和GPU
访问,而Private模式(MTLStorageModePrivate
)定义系统内存只能被GPU访问.Shared
模式是全部三种操做系统中的默认储存模式.函数
除了这两种储存模式外,macOS
还有一种Managed模式(MTLStorageModeManaged
),它为一种资源定义了一对同步内存,一个副本在系统内存中,另外一个在视频内存中来得到更快的CPU和GPU本地访问.
如今让咱们看看当咱们将数据缓冲器发送给GPU
时,GPU上面发生了什么.下面是个典型的顶点着色器例子:
vertex Vertices vertex_func(const device Vertices *vertices [[buffer(0)]],
constant Uniforms &uniforms [[buffer(1)]],
uint vid [[vertex_id]])
{
...
}
复制代码
Metal Shading Language
实现了地址空间修饰词来指定当函数变量或参数分配时的内存区域:
read-only只读
的.程序做用域内的变量必须被声明为常量地址空间,并在声明语句中被初始化.常量地址空间为多个实例在执行图形或内核函数时访问缓冲器中的同一块位置的作了优化.做为奖励,让咱们也看一下在Swift 3
中另外一种访问内存位置的方法.这段代码是从前面的文章The Model I/O framework中摘抄的,因此咱们就再也不讲解体素的细节了.只要想着咱们须要遍历一个数组来获取值:
let url = Bundle.main.url(forResource: "teapot", withExtension: "obj")
let asset = MDLAsset(url: url)
let voxelArray = MDLVoxelArray(asset: asset, divisions: 10, patchRadius: 0)
if let data = voxelArray.voxelIndices() {
data.withUnsafeBytes { (voxels: UnsafePointer<MDLVoxelIndex>) -> Void in
let count = data.count / MemoryLayout<MDLVoxelIndex>.size
let position = voxelArray.spatialLocation(ofIndex: voxels.pointee)
print(position)
}
}
复制代码
在本例中,MDLVoxelArray
对象有了个名为spatialLocation()
的函数,它让咱们用一个MDLVoxelIndex
类型的UnsafePointer
指针来遍历数组,并经过每一个位置的pointee
来访问数据.在本例中,咱们只打印出地址中的第一个值,但一个简单的循环可让咱们获得全部的数,像这样:
var voxelIndex = voxels
for _ in 0..<count {
let position = voxelArray.spatialLocation(ofIndex: voxelIndex.pointee)
print(position)
voxelIndex = voxelIndex.successor()
}
复制代码
源代码source code已发布在Github上.
下次见!