1.先来一段单张纹理贴图的shader示例代码:html
1 // Upgrade NOTE: replaced 'mul(UNITY_MATRIX_MVP,*)' with 'UnityObjectToClipPos(*)' 2 3 Shader "Custom/MyShader"{ 4 Properties{ 5 //外部可调属性 6 _MainTex ("Main Tex", 2D) = "white" {} 7 } 8 SubShader 9 { 10 //设置使用本Subshader所须要知足的渲染路径等参数,若是知足,即便用本shader 11 Tags {"Queue"="Transparent""RenderType"="Transparent"} 12 Pass 13 { 14 //设置该pass 的渲染状态和标签 15 Tags { "LightMode"="ForwardBase" } 16 //开始cg代码片断 17 CGPROGRAM 18 //该代码的编译指令, 19 #pragma vertex vert//设置顶点着色器的函数名称 20 #pragma fragment frag//设置片断着色器的函数名称 21 #include "Lighting.cginc"//包含库文件 22 23 struct a2v { 24 float4 vertex : POSITION;//当前要渲染的顶点坐标 25 float4 texcoord : TEXCOORD0;//当前要渲染的顶点的第一套纹理坐标 26 }; 27 28 struct v2f { 29 float4 pos : SV_POSITION;// 30 float2 uv : TEXCOORD0; 31 }; 32 sampler2D _MainTex; 33 float4 _MainTex_ST; 34 35 v2f vert(a2v v) 36 { 37 v2f o; 38 o.pos=UnityObjectToClipPos(v.vertex);//将顶点坐标变换到裁剪空间中 39 o.uv = TRANSFORM_TEX(v.texcoord,_MainTex);//变换uv坐标 40 return o; 41 } 42 43 fixed4 frag(v2f i):SV_Target 44 { 45 fixed4 c = tex2D (_MainTex, i.uv);//对纹理坐标进行采样 46 return c; 47 } 48 ENDCG 49 } 50 //SubShader 51 //{ 52 // //若是不知足第一个subshader所须要的条件,那么再来检测是否知足第二subshader 的条件。 53 //} 54 } 55 FallBack "Diffuse" 56 }
Shader "ShaderLab Tutorials/TestShader" { SubShader { //... } }
一个Shader有多个SubShader。一个SubShader可理解为一个Shader的一个渲染方案。即SubShader是为了针对不一样的渲染状况而编写的。每一个Shader至少1个SubShader、理论能够无限多个,但每每两三个就足够。
一个时刻只会选取一个SubShader进行渲染,具体SubShader的选取规则包括:android
按此规则第一个被选取的SubShader将会用于渲染,未被选取的SubShader在此次渲染将被忽略。编程
Shader "ShaderLab Tutorials/TestShader" { SubShader { Tags { "Queue"="Geometry+10" "RenderType"="Opaque" } //... } }
shader内部能够有标签(Tags)的定义。Tag指定了这个SubShader的渲染顺序(时机),以及其余的一些设置。windows
"RenderType"
标签。Unity能够运行时替换符合特定RenderType的全部Shader。Camera.RenderWithShader
或Camera.SetReplacementShader
配合使用。Unity内置的RenderType包括:
"Opaque"
:绝大部分不透明的物体都使用这个;"Transparent"
:绝大部分透明的物体、包括粒子特效都使用这个;"Background"
:天空盒都使用这个;"Overlay"
:GUI、镜头光晕都使用这个;RenderType
这个标签所取的值。Camera.RenderWithShader
或Camera.SetReplacementShader
不要求标签只能是RenderType
,RenderType
只是Unity内部用于Replace的一个标签而已,你也能够自定义本身全新的标签用于Replace。"Distort"="On"
,而后将"Distort"
做为参数replacementTag
传给函数。此时,做为replacementShader
实参的ShaderB.SubShaderB1中如有也有如出一辙的"Distort"="On"
,则此SubShaderB1将代替SubShaderA1用于本次渲染。"Queue"
标签。定义渲染顺序。预制的值为
"Background"
。值为1000。好比用于天空盒。"Geometry"
。值为2000。大部分物体在这个队列。不透明的物体也在这里。这个队列内部的物体的渲染顺序会有进一步的优化(应该是从近到远,early-z test能够剔除不需通过FS处理的片元)。其余队列的物体都是按空间位置的从远到近进行渲染。"AlphaTest"
。值为2450。已进行AlphaTest的物体在这个队列。"Transparent"
。值为3000。透明物体。"Overlay"
。值为4000。好比镜头光晕。"Queue"="Geometry+10"
"ForceNoShadowCasting"
,值为"true"
时,表示不接受阴影。"IgnoreProjector"
,值为"true"
时,表示不接受Projector组件的投影。另,关于渲染队列和Batch的非官方经验总结是,一帧的渲染队列的生成,依次决定于每一个渲染物体的:sass
这个渲染队列决定了以后(可能有dirty flag的机制?)渲染器再依次遍历这个渲染队列,“同一种”材质的渲染物体合到一个Batch里。数据结构
Shader "ShaderLab Tutorials/TestShader" { SubShader { Pass { //... } } }
一个SubShader(渲染方案)是由一个个Pass块来执行的。每一个Pass都会消耗对应的一个DrawCall。在知足渲染效果的状况下尽量地减小Pass的数量。架构
Shader "ShaderLab Tutorials/TestShader" { SubShader { Pass { Tags{ "LightMode"="ForwardBase" } //... } } }
shader有本身专属的Tag相似,Pass也有Pass专属的Tag。
其中最重要Tag是 "LightMode"
,指定Pass和Unity的哪种渲染路径(“Rendering Path”)搭配使用。除最重要的ForwardBase
、ForwardAdd
外,这里需额外提醒的Tag取值可包括:app
Always
,永远都渲染,但不处理光照ShadowCaster
,用于渲染产生阴影的物体ShadowCollector
,用于收集物体阴影到屏幕坐标Buff里。其余渲染路径相关的Tag详见下面章节“Unity渲染路径种类”。
具体全部Tag取值,可参考ShaderLab syntax: Pass Tags。编辑器
Shader "ShaderLab Tutorials/TestShader"{ SubShader { Pass {} } FallBack "Diffuse" // "Diffuse"即Unity预制的固有Shader // FallBack Off //将关闭FallBack }
当本Shader的全部SubShader都不支持当前显卡,就会使用FallBack语句指定的另外一个Shader。FallBack最好指定Unity本身预制的Shader实现,因其通常可以在当前全部显卡运行。ide
1 Shader "ShaderLab Tutorials/TestShader" 2 { 3 Properties { 4 _Range ("My Range", Range (0.02,0.15)) = 0.07 // sliders 5 _Color ("My Color", Color) = (.34, .85, .92, 1) // color 6 _2D ("My Texture 2D", 2D) = "" {} // textures 7 _Rect("My Rectangle", Rect) = "name" { } 8 _Cube ("My Cubemap", Cube) = "name" { } 9 _Float ("My Float", Float) = 1 10 _Vector ("My Vector", Vector) = (1,2,3,4) 11 12 // Display as a toggle. 13 [Toggle] _Invert ("Invert color?", Float) = 0 14 // Blend mode values 15 [Enum(UnityEngine.Rendering.BlendMode)] _Blend ("Blend mode", Float) = 1 16 //setup corresponding shader keywords. 17 [KeywordEnum(Off, On)] _UseSpecular ("Use Specular", Float) = 0 18 } 19 20 // Shader 21 SubShader{ 22 Pass{ 23 //... 24 uniform float4 _Color; 25 //... 26 float4 frag() : COLOR{ return fixed4(_Color); } 27 //... 28 #pragma multi_compile __ _USESPECULAR_ON 29 } 30 } 31 32 //fixed pipeline 33 SubShader { 34 Pass{ 35 Color[_Color] 36 } 37 } 38 }
Material
的接口(好比SetFloat
、SetTexture
编辑)[name]
(固定管线)或直接name
(可编程Shader)访问这些属性。有3种基本数值类型:float
、half
和fixed
。
这3种基本数值类型能够再组成vector和matrix,好比half3
是由3个half
组成、float4x4
是由16个float
组成。
float
:32位高精度浮点数。half
:16位中精度浮点数。范围是[-6万, +6万],能精确到十进制的小数点后3.3位。fixed
:11位低精度浮点数。范围是[-2, 2],精度是1/256。fixed
half
(即范围在[-6万, +6万]内、精确到小数点后3.3位);不然才使用float
。当提到“Row-Major”、“Column-Major”,根据不一样的场合,它们可能指不一样的意思:
上述状况,互不相干。
而后,ShaderLab中,数学上是Column Vector、访问接口上是Row-Major、存储上是(还没有查明)。
通常状况下,从Vertex Buff输入顶点到Vertex Shader,
vInModel
,vInModel = float4(xm, ym, zm, 1)
;vInWrold = mul(_Object2World , vInModel)
后,得出左手坐标系World Space中的vInWorld
,其为w=1的Homogenous Cooridniates(故等效于Cartesian Coordinates)vInWorld = float4(xw, yw, zw, 1)
;vInView = mul(UNITY_MATRIX_V , vInWrold)
后,得出右手坐标系View Space中的vInView
,其为w=1的Homogenous Cooridniates(故等效于Cartesian Coordinates)vInWorld = float4(xv, yv, zv, 1)
;vInClip = mul(UNITY_MATRIX_P , vInView)
后,得出左手坐标系Clip Space中的vInClip
,其为w每每不等于1的Homogenous Cooridniates(故每每不等效于Cartesian Coordinates)vInClip = float4(xc, yc, zc, wc)
;xc=(2nx+rz+lz)/(r-l)
;yc=(2ny+tz+bz)/(t-b)
;zc=(-fz-nz-2nf)/(f-n)
;wc=-z
;xc=(2nx+rz+lz)/(r-l)
;yc=(2ny+tz+bz)/(t-b)
;zc=(-fz-nf)/(f-n)
;wc=-z
;vInNDC = vInClip / vInClip.w
后,得出左手坐标系Normalized Device Coordinates中的vInNDC
,其为w=1的Homogenous Cooridniates(故等效于Cartesian Coordinates)vInNDC = float4(xn, yn, zn, 1)
。xn
和yn
的取值范围为[-1,1]。
zn=zc/wc=(fz+nz+2nf)/((f-n)z)
;zn=zc/wc=(fz+nf)/((f-n)z)
;zn
的取值范围能够这样决定:
UNITY_REVERSED_Z
已定义,zn
的取值范围是[UNITY_NEAR_CLIP_VALUE
, 0],即[1,0]UNITY_REVERSED_Z
未定义,zn
的取值范围是[UNITY_NEAR_CLIP_VALUE
, 1]
SHADER_API_D3D9
/SHADER_API_D3D11_9X
定义了,即[0,1]1 v2f vert (appdata v) 2 { 3 v2f o; 4 o.vertex = mul(UNITY_MATRIX_MVP, v.vertex); 5 // 1 、二、3是等价的,和4是不等价的 6 // 由于是M在左、V在右,因此是Column Vector 7 // 由于是HLSL/CG语言,因此是访问方式是Row-Major 8 o.rootInView = mul(UNITY_MATRIX_MV, float4(0, 0, 0, 1)); // 1 9 o.rootInView = float4(UNITY_MATRIX_MV[0].w, UNITY_MATRIX_MV[1].w, UNITY_MATRIX_MV[2].w, 1); // 2 10 o.rootInView = UNITY_MATRIX_MV._m03_m13_m23_m33; // 3 11 //o.rootInView = UNITY_MATRIX_MV[3]; // 4 12 13 return o; 14 } 15 16 fixed4 frag (v2f i) : SV_Target 17 { 18 // 由于是ViewSpace是右手坐标系,因此当root在view前面的时候,z是负数,因此须要-z才能正确显示颜色 19 fixed4 col = fixed4(i.rootInView.x, i.rootInView.y, -i.rootInView.z, 1); 20 return col; 21 } 22 23 struct appdata 24 { 25 float4 vertex : POSITION; 26 }; 27 struct v2f 28 { 29 float4 rootInView : TEXCOORD0; 30 float4 vertex : SV_POSITION; 31 };
固定管线是为了兼容老式显卡。都是顶点光照。以后固定管线多是被Unity抛弃的功能,因此最好不学它、当它不存在。特征是里面出现了形以下面Material
块、没有CGPROGRAM
和ENDCG
块。
1 Shader "ShaderLab Tutorials/TestShader" 2 { 3 Properties { 4 _Color ("My Color", Color) = (.34, .85, .92, 1) // color 5 } 6 7 // Fixed Pipeline 8 SubShader 9 { 10 Pass 11 { 12 Material{ 13 Diffuse [_Color] 14 Ambient [_Color] 15 } 16 17 Lighting On 18 } 19 } 20 }
1 Shader "ShaderLab Tutorials/TestShader" 2 { 3 Properties {} 4 5 SubShader 6 { 7 Pass 8 { 9 // ... the usual pass state setup ... 10 11 CGPROGRAM 12 // compilation directives for this snippet, e.g.: 13 #pragma vertex vert 14 #pragma fragment frag 15 16 // the Cg/HLSL code itself 17 float4 vert(float4 v:POSITION) : SV_POSITION{ 18 return mul(UNITY_MATRIX_MVP, v); 19 } 20 float4 frag() : COLOR{ 21 return fixed4(1.0, 0.0, 0.0, 1.0); 22 } 23 ENDCG 24 // ... the rest of pass setup ... 25 } 26 } 27 }
CGPROGRAM
和ENDCG
块#pragma
。详见官网Cg snippets。其中重要的包括:编译指令 | 示例/含义 |
---|---|
#pragma vertex name #pragma fragment name |
替换name,来指定Vertex Shader函数、Fragment Shader函数。 |
#pragma target name |
替换name(为2.0 、3.0 等)。设置编译目标shader model的版本。 |
#pragma only_renderers name name ... #pragma exclude_renderers name name... |
#pragma only_renderers gles gles3 ,#pragma exclude_renderers d3d9 d3d11 opengl ,只为指定渲染平台(render platform)编译 |
#include "UnityCG.cginc"
引入指定的库。经常使用的就是UnityCG.cginc
了。其余库详见官网Built-in shader include files。UNITY_MATRIX_MVP
就表明了这个时刻的MVP矩阵。详见官网ShaderLab built-in values。COLOR
、SV_Position
、TEXCOORD[n]
。完整的参数语义可见HLSL Semantic(因为是HLSL的链接,因此可能不彻底在Unity里可使用)。数据结构 | 含义 |
---|---|
appdata_base | vertex shader input with position, normal, one texture coordinate. |
appdata_tan | vertex shader input with position, normal, tangent, one texture coordinate. |
appdata_full | vertex shader input with position, normal, tangent, vertex color and two texture coordinates. |
appdata_img | vertex shader input with position and one texture coordinate. |
1 Shader "ShaderLab Tutorials/TestShader" 2 { 3 Properties { } 4 5 // Surface Shader 6 SubShader { 7 Tags { "RenderType" = "Opaque" } 8 CGPROGRAM 9 #pragma surface surf Lambert 10 struct Input { 11 float4 color : COLOR; 12 }; 13 void surf (Input IN, inout SurfaceOutput o) { 14 o.Albedo = 1; 15 } 16 ENDCG 17 } 18 FallBack "Diffuse" 19 }
CGPROGRAM
和ENDCG
块。(而不是出如今Pass里。由于SurfaceShader本身会编译成多个Pass。)#pragma surface surfaceFunction lightModel [optionalparams]
surfaceFunction
:surfaceShader函数,形如void surf (Input IN, inout SurfaceOutput o)
lightModel
:使用的光照模式。包括Lambert
(漫反射)和BlinnPhong
(镜面反射)。
#pragma surface surf MyCalc
half4 LightingMyCalc (SurfaceOutput s, 参数略)
函数进行处理(函数名在签名加上了“Lighting”)。Input
)、编写本身的Surface函数处理输入、最终输出修改事后的SurfaceOutput。SurfaceOutput的定义为 struct SurfaceOutput { half3 Albedo; // 纹理颜色值(r, g, b) half3 Normal; // 法向量(x, y, z) half3 Emission; // 自发光颜色值(r, g, b) half Specular; // 镜面反射度 half Gloss; // 光泽度 half Alpha; // 不透明度 };
点击a.shader
文件的“Compile and show code”,能够看到该文件的“编译”事后的ShaderLab shader文件,文件名形如Compiled-a.shader
。
其依然是ShaderLab文件,其包含最终提交给GPU的shader代码字符串。
先就其结构进行简述以下,会发现和上述的编译前ShaderLab结构很类似。
1 // Compiled shader for iPhone, iPod Touch and iPad, uncompressed size: 36.5KB 2 // Skipping shader variants that would not be included into build of current scene. 3 Shader "ShaderLab Tutorials/TestShader" 4 { 5 Properties {...} 6 SubShader { 7 // Stats for Vertex shader: 8 // gles : 14 avg math (11..19), 1 avg texture (1..2) 9 // metal : 14 avg math (11..17) 10 // Stats for Fragment shader: 11 // metal : 14 avg math (11..19), 1 avg texture (1..2) 12 Pass { 13 Program "vp" // vertex program 14 { 15 SubProgram "gles" { 16 // Stats: 11 math, 1 textures 17 Keywords{...} // keywords for shader variants ("uber shader") 18 19 //shader codes in string 20 " 21 #ifdef VERTEX 22 vertex shader codes 23 #endif 24 25 // Note, on gles, fragment shader stays here inside Program "vp" 26 #ifdef FRAGMENT 27 fragment shader codes 28 #endif 29 " 30 } 31 32 SubProgram "metal" { 33 some setup 34 Keywords{...} 35 36 //vertex shader codes in string 37 "..." 38 } 39 } 40 41 Program "fp" // fragment program 42 { 43 SubProgram "gles" { 44 Keywords{...} 45 "// shader disassembly not supported on gles" //(because gles fragment shader codes are in Program "vp") 46 } 47 48 SubProgram "metal" { 49 common setup 50 Keywords{...} 51 52 //fragment shader codes in string 53 "..." 54 } 55 } 56 } 57 } 58 59 ... 60 }
开发者能够在Unity工程的PlayerSettings设置对渲染路径进行3选1:
每一个渲染路径的内部会再分为几个阶段。
而后,Shader里的每一个Pass,均可以指定为不一样的LightMode。而LightMode实际就是说:“我但愿这个Pass在这个XXX渲染路径的这个YYY子阶段被执行”。
渲染路径内部子阶段 | 对应的LightMode | 描述 |
---|---|---|
Base Pass | "PrepassBase" |
渲染物体信息。即把法向量、高光度到一张ARGB32的物体信息纹理上,把深度信息保存在Z-Buff上。 |
Lighting Pass | 无对应可编程Pass | 根据Base Pass得出的物体信息,在屏幕坐标系下,使用BlinnPhong光照模式,把光照信息渲染到ARGB32的光照信息纹理上(RGB表示diffuse颜色值、A表示高光度) |
Final Pass | "PrepassFinal" |
根据光照信息纹理,物体再渲染一次,将光照信息、纹理信息和自发光信息最终混合。LightMap也在这个Pass进行。 |
渲染路径内部子阶段 | 对应的LightMode | 描述 |
---|---|---|
Base Pass | "ForwardBase" |
渲染:最亮一个的方向光光源(像素级)和对应的阴影、全部顶点级光源、LightMap、全部LightProbe的SH光源(Sphere Harmonic,球谐函数,效率超高的低频光)、环境光、自发光。 |
Additional Passes | "ForwardAdd" |
其余须要像素级渲染的的光源 |
注意到的是,在Forward Rendering中,光源多是像素级光源、顶点级光源或SH光源。其判断标准是:
另外,配置成“Auto”的光源有更复杂的判断标注,截图以下:
具体可参考Forward Rendering Path Details。
渲染路径内部子阶段 | 对应的LightMode | 描述 |
---|---|---|
Vertex | "Vertex" |
渲染无LightMap物体 |
VertexLMRGBM | "VertexLMRGBM" |
渲染有RGBM编码的LightMap物体 |
VertexLM | "VertexLM" |
渲染有双LDR编码的LightMap物体 |
一个工程的渲染路径是惟一的,但一个工程里的Shader是容许配有不一样LightMode的Pass的。
在Unity,策略是“从工程配置的渲染路径模式开始,按Deferred、Forward、VertxLit的顺序,搜索最匹配的LightMode的一个Pass”。
好比,在配置成Deferred路径时,优先选有Deferred相关LightMode的Pass;找不到才会选Forward相关的Pass;还找不到,才会选VertexLit相关的Pass。
再好比,在配置成Forward路径时,优先选Forward相关的Pass;找不到才会选VertexLit相关的Pass。
《The Mali GPU: An Abstract Machine》系列以Arm Mali GPU为例子给出了全面的讨论,现简述以下:
eglSwapBuffers()
或Present()
来区分帧)的Command时,OS会经过eglSwapBuffers()
或Present()
来阻塞CPU让其进入idle,从而防止更多后续Command的提交discard
或clip
、在Fragment Shader里修改深度值、半透明,将不能进行Early-ZS,只好使用传统的Late-ZS