nity(或者说基本全部图形引擎)生成一帧画面的处理过程大体能够这样简化描述:引擎首先通过简单的可见性测试,肯定摄像机能够看到的物体,而后把这些物体的顶点(包括本地位置、法线、UV等),索引(顶点如何组成三角形),变换(就是物体的位置、旋转、缩放、以及摄像机位置等),相关光源,纹理,渲染方式(由材质/Shader决定)等数据准备好,而后通知图形API——或者就简单地看做是通知GPU——开始绘制,GPU基于这些数据,通过一系列运算,在屏幕上画出成千上万的三角形,最终构成一幅图像。
在Unity中,每次引擎准备数据并通知GPU的过程称为一次Draw Call。这一过程是逐个物体进行的,对于每一个物体,不仅GPU的渲染,引擎从新设置材质/Shader也是一项很是耗时的操做。所以每帧的Draw Call次数是一项很是重要的性能指标,对于iOS来讲应尽可能控制在20次之内,这个值能够在编辑器的Statistic窗口看到。
Unity内置了Draw Call Batching技术,从名字就能够看出,它的主要目标就是在一次Draw Call中批量处理多个物体。只要物体的变换和材质相同,GPU就能够按彻底相同的方式进行处理,便可以把它们放在一个Draw Call中。Draw Call Batching技术的核心就是在可见性测试以后,检查全部要绘制的物体的材质,把相同材质的分为一组(一个Batch),而后把它们组合成一个物体(统一变换),这样就能够在一个Draw Call中处理多个物体了(其实是组合后的一个物体)。
但Draw Call Batching存在一个缺陷,就是它须要把一个Batch中的全部物体组合到一块儿,至关于建立了一个与这些物体加起来同样大的物体,与此同时就须要分配相应大小的内存。这不只会消耗更多内存,还须要消耗CPU时间。特别是对于移动的物体,每一帧都得从新进行组合,这就须要进行一些权衡,不然得不偿失。但对于静止不动的物体来讲,只须要进行一次组合,以后就能够一直使用,效率要高得多。
Unity提供了Dynamic Batching和Static Batching两种方式。Dynamic Batching是彻底自动进行的,不须要也没法进行任何干预,对于顶点数在300之内的可移动物体,只要使用相同的材质,就会组成Batch。Static Batching则须要把静止的物体标记为Static,而后不管大小,都会组成Batch。如前文所说,Static Batching显然比Dynamic Batching要高效得多,因而,Static Batching功能是收费的……
要有效利用Draw Call Batching,首先是尽可能减小场景中使用的材质数量,即尽可能共享材质,对于仅纹理不一样的材质能够把纹理组合到一张更大的纹理中(称为Texture Atlasing)。而后是把不会移动的物体标记为Static。此外还能够经过CombineChildren脚本(Standard Assets/Scripts/Unity Scripts/CombineChildren)手动把物体组合在一块儿,但这个脚本会影响可见性测试,由于组合在一块儿的物体始终会被看做一个物体,从而会增长GPU要处理的几何体数量,所以要当心使用。
对于复杂的静态场景,还能够考虑自行设计遮挡剔除算法,减小可见的物体数量同时也能够减小Draw Call。
总之,理解Draw Call和Draw Call Batching原理,根据场景特色设计相应的方案来尽可能减小Draw Call次数才是王道,其它方面亦然。
U3D DrawCall优化手记
http://www.cnblogs.com/ybgame/p/3588795.html
在最近,使用U3D开发的游戏核心部分功能即将完成,中间因为各类历史缘由,致使项目存在比较大的问题,这些问题在最后,恐怕只能经过一次完全的重构来解决
如今的游戏跑起来会有接近130-170个左右的DrawCall,游戏运行起来明显感受到卡,而通过一天的优化,DrawCall成功缩减到30-70个,这个效果是很是显著的,而且这个优化并无经过将现有的资源打包图集来实现,图集都是原有的图集,若是从全局的角度对图集再进行一次优化,那么DrawCall还能够再减小十几个
本次优化的重点包括:层级关系和特效
对于U3D,我是一个菜鸟,对于U3D的一些东西是只知其一;不知其二,例如DrawCall,我获得的是一些并不彻底正确的信息,例如将N个纹理打包成一个图集,这个图集就只会产生一个DrawCall,若是不打成图集,那么就会有N个DrawCall,这个观点在不少人的认识里都是正确的,由于能够经过简单的操做来验证,但严格来讲,这个观点是错误的,由于它还受层级关系影响!
渲染顺序
U3D的渲染是有顺序的,U3D的渲染顺序是由咱们控制的,控制好U3D的渲染顺序,你才能控制好DrawCall
一个DrawCall,表示U3D使用这个材质/纹理,来进行一次渲染,那么此次渲染假设有3个对象,那么当3个对象都使用这一个材质/纹理的时候,就会产生一次DrawCall,能够理解为一次将纹理输送到屏幕上的过程,(实际上引擎大多会使用如双缓冲,缓存这类的手段来优化这个过程,但在这里咱们只须要这样子认识就能够了),假设3个对象使用不一样的材质/纹理,那么无疑会产生3个DrawCall
接下来咱们的3个对象使用2个材质,A和B使用材质1,C使用材质2,这时候来看,应该是有2个DrawCall,或者3个DrawCall。应该是2个DrawCall啊,为何会有3个DrawCall???并且是有时候2个,有时候3个。咱们按照上面的DrawCall分析流程来分析一下:
1.渲染A,使用材质1
2.渲染B,使用材质1
3.渲染C,使用材质2
在这种状况下是2个DrawCall,在下面这种状况下,则是3个DrawCall
1.渲染A,使用材质1
2.渲染C,使用材质2
3.渲染B,使用材质1
由于咱们没有控制好渲染顺序(或者说没有去特地控制),因此致使了额外的DrawCall,由于A和B不是一次性渲染完的,而是被C打断了,因此致使材质1被分为两次渲染
那么是什么在控制这个渲染顺序呢?首先在多个相机的状况下,U3D会根据相机的深度顺序进行渲染,在每一个相机中,它会根据你距离相机的距离,由远到近进行渲染,在UI相机中,还会根据你UI对象的深度进行渲染
那么咱们要作的就是,对要渲染的对象进行一次规划,正确地排列好它们,规则是,按照Z轴或者深度,对空间进行划分,而后肯定好每一个对象的Z轴和深度,让使用同一个材质的东西,尽可能保持在这个空间内,不要让其余材质的对象进入这个空间,不然就会打断这个空间的渲染顺序
在这个基础上,更细的规则有:
- 场景中的东西,咱们使用Z轴来进行空间的划分,例如背景层,特效层1,人物层,特效层2
- NGUI中的东西,咱们统一使用Depth来进行空间的划分
- 人物模型,当人物模型只是用一个材质,DrawCall只有1,可是用了2个以上的材质,DrawCall就会暴增(或许对材质的RenderQueue进行规划也可使DrawCall只有2个,但这个要拆分好才行),3D人物处于复杂3D场景中的时候,咱们的空间规则不免被破坏,这只能在设计的时候尽可能去避免这种状况了
- 使用了多个材质的特效,在动画的过程当中,每每会引发DrawCall的波动,在视觉效果能够接受的范围内,能够将特效也进行空间划分,假设这个特效是2D显示,那么可使用Z轴来划分空间
打包图集
每一个材质/纹理的渲染必定是会产生DrawCall的,这个DrawCall只能经过打包图集来进行优化
制做图集通常遵循几个规则:
- 从功能角度进行划分,例如UI能够划分为公共部分,以及每一个具体的界面,功能上,显示上密切相关的图片打包到一块儿
- 不要一股脑把全部东西打包到一个图集里,特别是那些不可能同时出现的东西,它们就不该该在一个图集里,这样的图集意义不大,减小不了DrawCall,而且一个你不须要显示的图片,会一直占用你的内存,这让我很是不爽
- 注意控制图集的大小,不要让图集太大,一个超级大图集的DrawCall消耗或许顶的上十几个小图集的消耗
字符图集,在使用BMFont或者其余工具生成图片字的时候,咱们每每是直接导入一大串文字,而后直接生成图片,但实际上这上面的操做也有优化空间,例如BMFont生成的图片大小,是能够设置的,有两个规则,一个规则是导出的图片尽可能小,另外一个是导出的图片尽可能少,默认的大小应该是512x512,假设你生成的图片256x256就能够容纳,那么多作一个操做你能够节省这么多空间,另外当你输入多几个字,就致使增长一张图片时,例如1024变成2048,那么你能够考虑使用3张512的图片,这样也会节省空间
通过精心划分的图集在加上精心规划的渲染顺序,DrawCall会有一个质的优化
特效清理
U3D提供了很是便捷的方法让咱们很轻易地使用美术给过来的特效,懒惰的U3D程序猿会直接放入U3D,甚至不去看这是个什么特效,咱们的特效通常都是一瞬间的事情,例如技能特效,或者其余什么特效,那么特效播放完,这个特效咱们就看不到了,但假设这个特效在播放结束的时候,没有将自身的Active属性设置为false,那么它就会继续占用你的DrawCall,消耗你设备的计算能力,因此程序须要保证当一个特效播放完以后,可以被消耗,或者设置为非激活的状态,可使用一些公共方法来完成特效播放完以后的清理工做(本身实现2个静态函数,一个播放完销毁,一个播放完设置未激活)
完成DrawCall的优化以后,接下来就是内存的优化了,(内存优化手记 待续)