注:面向数据编程文章已更新成markdown形式,并添加修改了一些内容,而本文则做为旧文再也不更新维护。html
最新版博文以下:程序员
【游戏设计模式——面向数据编程(新)】 https://www.cnblogs.com/KillerAery/p/11746639.html
编程
前言:随着软件需求的日益复杂发展,远古时期面的向过程编程思想才渐渐萌生了面向对象编程思想。设计模式
当人们发现面向对象在应对高层软件的种种好处时,愈来愈沉醉于面向对象,热衷于研究如何更加优雅地抽象出对象。数组
然而现代开发中渐渐发现面向对象编程层层抽象形成臃肿,致使运行效率下降,而这是性能要求高的游戏编程领域不想看到的。缓存
因而现代游戏编程中,面向数据编程的思想愈来愈被接受(例如Unity2018更新的ECS框架就是一种面向数据思想的框架)。markdown
先来一个简单的比较:数据结构
那么所谓的考虑数据存储/布局是什么意思呢?框架
先引入一个有关CPU处理数据的概念:CPU多级缓存。函数
要尽量提升CPU缓存命中率,就是要尽可能让使用的数据连续在一块儿。
因为面向数据编程技巧不少,本文篇幅有限,只介绍部分。
1,传统的组件模式,每每让游戏对象持有一个或多个组件的引用数据(指针数据)。
(一个典型的游戏对象类,包含了2种组件的指针)
class GameObject {
//....GameObject的属性
Component1* m_component1; Component2* m_component2; };
下面一幅图显示了这种传统模式的结构:
游戏对象/组件每每是批处理操做较多(每帧更新/渲染/或其余操做)的对象。
这个传统结构相应的每帧更新代码:
GameObject g[MAX_GAMEOBJECT_NUM]; for(int i = 0; i < GameObjectsNum; ++i) { g[i].update(); if(g[i].componet1 != nullptr)g[i].componet1->update(); if(g[i].componet2 != nullptr)g[i].componet2->update(); }
而根据图中能够看到,这种指来指去的结构对CPU缓存极其不友好:为了访问组件老是跳转到不相邻的内存。
假若游戏对象和组件的更新顺序不影响游戏逻辑,则一个可行的办法是将他们都以连续数组形式存在。
注意是对象数组,而不是指针数组。若是是指针数组的话,这对CPU缓存命中没有意义(由于要经过指针跳转到不相邻的内存)。
GameObject g[MAX_GAMEOBJECT_NUM];
Component1 a[MAX_COMPONENT_NUM];
Component2 b[MAX_COMPONENT_NUM];
(连续数组存储能让下面的批处理中CPU缓存命中率较高)
for (int i = 0; i < GameObjectsNum; ++i) { g[i].update(); } for (int i = 0; i < Componet1Num; ++i) { a[i].update(); } for (int i = 0; i < Componet2Num; ++i) { b[i].update(); }
2,这是一个简单的粒子系统:
const int MAX_PARTICLE_NUM = 3000; //粒子类 class Particle { private: bool active; Vec3 position; Vec3 velocity; //....其它粒子所需方法 }; Particle particles[MAX_PARTICLE_NUM]; int particleNum;
它使用了典型的lazy策略,当要删除一个粒子时,只需改变active标记,无需移动内存。
而后利用标记判断,每帧更新的时候能够略过删除掉的粒子。
当须要建立新粒子时,只须要找到第一个被删除掉的粒子,更改其属性便可。
for (int i = 0; i < particleNum; ++i) { if (particles[i].isActive()) { particles[i].update(); } }
表面上看这很科学,实际上这样作CPU缓存命中率不高:每次批处理CPU缓存都加载过不少不会用到的粒子数据(标记被删除的粒子)。
一个可行的方法是:当要删除粒子时,将队列尾的粒子内存复制到该粒子的位置,并记录减小后的粒子数量。
(移动内存(复制内存)操做是程序员最不想看到的,可是实际执行批处理带来的速度提高相比删除的开销多的很是多,除非你移动的内存对象大小实在大到使人发指)
particles[i] = particles[particleNum];
particleNum--;
这样咱们就能够保证在这个粒子批量更新操做中,CPU缓存老是能以高命中率击中。
for (int i = 0; i < particleNum; ++i) { particles[i].update(); }
有人可能认为这样能最大程度利用CPU缓存:把一个对象全部要用的数据(包括组件数据)都塞进一个类里,而没有任何用指针或引用的形式间接存储数据。
实际上这个想法是错误的,咱们不能忽视一个问题:CPU缓存的存储空间是有限的
因而咱们但愿CPU缓存存储的是常用的数据,而不是那些少用的数据。这就引入了冷数据/热数据分割的概念了。
热数据:常常要操做使用的数据,咱们通常能够直接做为可直接访问的成员变量。
冷数据:比较少用的数据,咱们通常以引用/指针来间接访问(即存储的是指针或者引用)。
一个栗子:对于人类来讲,生命值位置速度都是常常须要操做的变量,是热数据;
而掉落物对象只有人类死亡的时候才须要用到,因此是冷数据;
class Human { private: float health; float power; Vec3 position; Vec3 velocity; LootDrop* drop; //.... }; class LootDrop{ Item[2] itemsToDrop; float chance; //.... };
C++的虚函数机制,简单来讲是两次地址跳转的函数调用,这对CPU缓存十分不友好,每每命中失败。
实际上虚函数能够优雅解决不少面向对象的问题,然而在游戏程序若是有不少虚函数都要频繁调用(例如每帧调用),很容易引起性能问题。
解决方法是,把这些频繁调用的虚函数尽量去除virtual特性(即作成普通成员函数),并避免调用基类对象的成员函数,代价是这样一改得改不少与之牵连代码。
因此最好一开始设计程序时,须要先想好哪些最好不要写成virtual函数。
这实际上就是在优雅与性能之间寻求一个平衡。
面向数据编程还有更多小细节,可是这些都不经常使用,就只做为一种思考面向数据编程的另类角度。
对多维数组的遍历:int a[100][100];
for(int x=0;x<100;++x) for(int y=0;y<100;++y) a[x][y]; for(int y=0;y<100;++y) for(int x=0;x<100;++x) a[x][y];
内循环应该是对x递增仍是对y递增比较快?答案是:对y递增比较快。
由于对 y 的递增,结果是一个int大小的跳转,也就是说容易访问到相邻的内存,即容易击中CPU缓存。
而对 x 的递增,结果是100个int大小的跳转,不容易击中CPU。
而内循环若是是y的话,那么就能内外循环总共递增100*100次y。
但内循环若是是x的话,那么就内外循环总共只能递增100次y,相比上者,CPU击中比较少。
该更新一下我对面向对象和面向数据的见解:
先说结论:应该兼有。由于游戏程序是一个既须要高性能又复杂的工程。
使用面向对象的游戏程序新手,经常就有一个问题:过分设计/过分抽象,什么都想用设计模式封装一下抽象一下。
这就很容易致使一些过分设计/过分抽象致使游戏性能太差。
博主如今的项目风格都比较偏向面向数据思想,尽可能减小虚函数的使用,多利用数据组合成对象,而不是重写各类基类虚函数。
对于一些数据结构的考量,也尽可能偏多使用连续存储的结构(例如数组)。
如何兼有两种思想,这种玄学的问题可能得靠本身去感悟,多尝试和测试性能差异。
游戏设计模式系列-其余文章: