HLOD System

1.1 HLOD System简介

       首先,HLOD System主要的目标是为了减小Draw Call。而后,进行更多的Batch批处理,从而大大提升渲染性能,减小面数和纹理,这样咱们相应地节省了内存,并提高了加载时间。
       HLOD System只针对当前所在的地方进行加载,它会流式加载网格和纹理,在后台进行异步的操做。html

       本次HLOD是基于官方AutoLOD代码的扩展和改进制做出来的,连接:https://github.com/Unity-Technologies/AutoLOD,连接是AutoLOD的文章,能够先看看。下面将详细介绍HLOD原理和实现。git

1.2 HLOD与LOD对比

       HLOD与传统LOD差别对好比表所示。github

 

LOD架构

HLOD异步

减面性能

测试

优化

减小Batches、纹理数量spa

×设计

减小内存使用

×

CPU性能提高

×

磁盘空间

=

+

2.1 系统支持

  1. BVH划分LOD Group
  2. 根据BVH划分进行合并模型和贴图
  3. HLOD CULL系统

2.2 系统概述

 1.系统架构

      系统主要由编辑层和运行层组成,编辑层负责每一个预制体的LODGroup生成、BVH划分、网格、贴图合并,同时自动作好运行层所须要的关联。运行层负责该系统中Renderder、LODGroup管理及BVH层级切换,系统架构如图所示。

 

 2.系统流程

    本套系统拥有一条完整流程,其系统流程如图所示。

 

2.3 BVH划分LOD Group

    八叉树对LOD Group进行划分到各个区域,划分条件由每一个区域超过n个mesh开始划分,划分依据由LOD Group中心点做为划分点,可设置剔除实际包围盒超过指定大小的mesh,划分规则如图2-4所示。

 

划分后效果如图所示。

    

        这里划分方式对AutoLOD进行了改进,AutoLOD划分方式以下图所示,下图是BVH划分的同一级别中其中的4个区域,圈内是一组LodGroup,AutoLOD在进行BVH划分规则是只要该组LodGroup有任何模型与区域接触,那么该组LodGroup就会被算入该区域,图中4角星与二、三、4区域同时有相交,所以在模型合并的时候这3个区域都会将该组LodGroup下的模型合并。假设HLOD切换到了该层级且同时显示二、三、4节点的合并模型,那么这个LodGroup合并的模型就会被显示了3份,这样的效果是不容许的,解决办法就是同一个层级每一个区域不能出现相同的LodGroup。

     

    本次HLOD采用的解决办法是使用LodGroup的中心点进行划分,这样就能够保证一个LodGroup最多能被一个区域包含,以下图所示,箭头指向的点就是LodGroup的中心点,它只有4这个区域包含。

 

2.4 根据BVH划分进行合并模型和贴图

1.合并原理

       根据2.3的划分,能够设置合并几层的模型(从最底下开始计算),以下图所示的为合并2层,其中第一层(最底层)有三个区域合并,第二层有两个区域合并。这里节点比2.3少了,是由于没用的节点会被剔除掉,若是这里设置只合并一层也就是最底层,那么上面两层也会被剔除掉。

 

 

2.合并的网格

      网格每生成一层就会多一倍以上磁盘大小,若是重复的模型多了,那么合并后的网格磁盘大小将会成倍增长,合并后的网格以下图所示。

例如:(300*300M场景),原始网格6M磁盘空间,合并原始网格两层后多出20M空间(fbx)。

 

 

3.合并的贴图

     以下图,贴图目前只保留了MainTex贴图,默认使用Standard物理光照shader(带阴影),支持GPU Instancing。

 

     贴图合并规则以下图所示,设置合并层次,好比图中设置3层,那么第三层是全部子节点合集的大贴图(不重复)。

     例如:300*300M场景,原始贴图大小26M,合并原始网格两层后多出50M,多出这么多主要是由于把整个场景合并,原始贴图不少是共用的,致使合并后内存上升问题,因此合并时选择模型和贴图复用性低的模型合并比较好。

 

2.6 HLOD CULL系统

1.如何工做

      当上述步骤作好后,在BVH的根节点上会有个HLOD CULL脚本,用于控制当前管理的HLOD的切换。

      当摄像机靠近部分精细模型时,HLOD切换状态如图2-10所示(红色为当前显示的层级,蓝色为不显示层级)。

当摄像机靠近少部分精细模型时,HLOD切换状态以下图所示。

 

 

 

 

当摄像机距离精细模型比较远时,HLOD切换状态如图2-12所示。

 

2.计算原理

   首先是精细度模型是否须要显示计算,根据距离LOD Group的距离、屏幕占比与摄像机FieldOfView计算出relativeHeight,这个数值对应如图2-14所示的摄像机位置,若是这个数值不指向最精细模型,那么就显示合批模型。

 

relativeHeight表示

 

3.工做原理

如图2-15所示,LODGroup的计算只会计算最精细的模型,只要有一个精细模型被激活那么该节点的精细模型都会被激活,父节点的全部HLOD被dirty并隐藏。若是精细模型不激活,那么直到找到父节点被dirty或已是最顶层状况激活当前层HLOD。

 

HLOD流式加载

3.1 流式系统设计

    流式加载的设计主要针对移动端内存占用太高问题,利用流式加载能够作到极大下降移动端运行常驻的内存。设计如图3-1所示。

    首先,一个HLOD System里面有多颗子树,每颗子树都会带有一个流式管理器,该管理器负责当前子树的全部节点流式加载,而HLOD Cull系统负责通知每颗子树哪些节点状态出现了变更。

 

3.2 流式资源加载设计

以下图,流式加载有两种模式,通过大量测试,总结出了各自优缺点。

1.装完再卸载

当前子树下,全部须要加载的节点加载完毕后再卸载须要卸载的。

优势:能够保证模型常在视区

缺点:常常会出现内存峰值,常常会卡帧

2.直接卸

当前子树下,卸载不等待其余节点加载完就卸载

优势:极大避免卡帧问题,少量出现内存峰值问题。

缺点:不可保证模型常在视区,加载的模型内存大可能会出现闪烁现象。

 

3.3 流式加载距离缓冲设计

常常会出现玩家在加载边沿处来回走动,这会形成资源不断的来回装卸,所以加入距离缓冲策列。

设定必定距离的缓冲,当触发流式切换后,要再次激活流式切换须要走出设定的缓冲距离才会切换,设计如图3-3所示。

4、适用

HLOD Stream应用场景:

1.大城镇,不少房屋须要处理不少Bathces的状况

2.须要看得远,远处看得见轮科且数量较多的状况使用

3.物件密集而且没法使用GPU Instancing的地方使用

4.只要有不少Batches的地方而没法优化掉的均可以考虑使用

5、问题

1.贴图合并只保留MainTex贴图,默认使用Standard物理光照shader(带阴影),支持GPU Instancing。

2.相同的预制体的网格合并时内存会翻倍(这个跟静、动态合批同样)

3.每生成一层HLOD所须要的网格内存会多一倍以上

4.不一样子树相同贴图会出现重复贴图合并现象。

相关文章
相关标签/搜索