今天的干货来自技术驱动场的嘉宾周潜,他是网易游戏大话事业部高级技术经理。
以下是嘉宾分享实录:(部分删减与调整)
大家好,我是来自网易游戏大话事业部的技术专家周潜,今天邀请大家跟我一起走进极速光影的世界,来把我们在高品质赛车游戏的一个光照方案分享给大家。
首先来介绍一下我们的游戏产品,名字叫Racing Master,中文名“巅峰极速”。我们的目标是去打造一个高品质、高拟真、高画质的一个赛车游戏。
游戏中有非常丰富的场景以及鲜艳的色彩,赛车的物理是完全写实的,漂移也是用真实的物理去计算的。
玩家可以对车辆进行非常丰富的自定义,包括改装、涂装等等。在大厅界面有车辆展示系统,车辆的建模是非常精致的,并且车灯、车漆这些内容都是还原度非常高的,在夜景下也有十分写实的全局光照。
通过以上介绍,相信大家对我们游戏的美术品质有了一个大概的概念。为了达到这样的美术品质,我们面临的最大一个难点,就是“实时全局光照”。
实时全局光照分为两个部分:直接光照和间接光照。为了在移动端实现这一目标,我们需要面临非常多的挑战,包括:宽带、性能、以及兼容性等等。此外,还有着许多束缚,比如说我们需要用Forward管线来减少宽带,毕竟我们还要减少DP,以及减少Pass等等。
那么,直接光照和间接光照在游戏里延伸出来两个需要解决的问题,就是“实时多光源”和“实时环境捕捉”,我们今天的话题就从这两个问题开始。
一、实时多光源
“多光源”在游戏里是非常常见的,比如在夜景下,会有许多路灯、车灯以及车辆的回火等等,它们会照亮周围的物体。
这个是我们赛车在经过一排路灯下的表现,除了路灯之外,车辆还有一个前置灯。这么多的动态光源在Forward管线下是难以实现的。
因此,许多人对Forward管线进行了改进,以此来支持多光源。
首先是屏幕空间的Tile Shading,又称为Forward+,它的思路是把屏幕空间划分为多个格子,然后每个格子配合深度Buffer去进行灯光求交计算。这样我们就能知道每一个格子里会有哪些灯光对其有影响,从而减少每个像素需要计算的灯光数量。
它虽然能够解决多光源的问题,但需要一个预绘制深度的Buffer,即一个PreZ Pass。但如果当游戏场景非常丰富时,PreZ Pass便会带来非常多的Draw Call,这对于我们来说是不能接受的。
此外,Tile Shading的求交计算必须得在Compute Shader里面进行,可对于许多手机而言,关于Compute Shader的支持效果并不友好。
另外还有一种方案是Clustered Shading,它的思路是在Forward+的基础之上,对深度空间进一步地划分,将视锥体划分为多个视锥体分块,之后再对每个分块进行灯光求交计算。
但同样的,Clustered Shading也需要一个PreZ Pass,并且它的求交计算也需要放在Compute Shader当中去进行。
为了在移动端去解决这些问题,我们提出了一种新的多光源方案,叫做“Grid Shading”。
Grid Shading的思路是在世界空间上,沿着XY轴方向进行齐轴的对齐网格划分;然后采用一张灯光索引图,其中每个像素代表一个格子且包含该格子内所受到的光源编号。
每个像素用RGBA四个通道,可以记录四盏灯光。若灯光数目超出了四盏,则需要对这些灯光进行贡献度排序。
贡献度,即灯光的光照强度。在排序之后只保留贡献度最大的四盏灯光于这个像素当中。而灯光信息则通过UniformBuffer上传。
此外,我们可以在Z轴方向进行多层扩展,这样就可以达到覆盖范围更广的目的。
通过Grid Shading在场景中的应用可以看到,场景里产生了一个XY方向上64x64的网格,并且我们在摄像机水平高度方向上,向上向下各扩展两层。因此产生的总网格大小是64x64x4。
但由于网格是扁平形状的,所以它只能覆盖较为水平的范围,并且使用这种方案时,玩家的视野范围也必须受到限制,得在水平方向上的视野。
可在赛车游戏里,赛道基本是平铺的,且玩家的视野基本处于水平方向,所以需要照亮的场景物体,包括赛车、路面等等都正好在覆盖范围之内。因而,产生的网格基本上能满足我们的需求。
Grid Shading的流程如下。
首先需要对灯光进行遍历,根据灯光的包围盒计算出格子的范围,然后在CPU层对每个格子进行求交计算。
接着计算出光照贡献度并进行排序,将结果填充到灯光索引图当中,并上传灯光信息。
最后,在绘制阶段,每个像素根据在GPU世界坐标的位置,计算出它所在的格子。并且在灯光索引图中,查找出它所需要计算的灯光编号,计算灯光的光照。
在这当中最难的一个点是格子的求交计算。每个格子的形状是立方体,可以把它近似成一个包围球。如果对方是点光源,则灯光范围恰好也是球体,球体与球体之间的求交计算非常简单。
但如果对方是聚光灯,聚光灯的范围是圆锥体,那么该如何做圆锥体与球体的求交计算呢?通常情况下,我们一般是提取出圆锥的包围球,然后将该包围球与格子的包围球进行求交计算。
虽然这种比较简单,但结果非常不精确,因为圆锥包围球的大小与圆锥本身的大小差异非常大。为此,就需要一种更精确计算圆锥和包围球的方法。思路如下。
首先,将圆锥的顶点置于一个大球的球心,则圆锥体的范围可以看作是该大球的一个球面角内。然后根据大球和格子包围球的位置关系,可以将求交情况划分为4种。
第一种情况非常简单,即格子包围球包含了圆锥体顶点,根据这种情况可以很清楚地看到包围球与圆锥体相交。
第二种情况是包围球与圆锥体大球相互分离,那么根据这种情况,则可以看到格子包围球与圆锥不可能相交。
剩下两种情况较为复杂。第三种情况是,格子包围球有不超过一半的体积在大球内部。那么此时就需要将相交的部分转化成一个球面角,接着用该球面角与圆锥体的球面角进行相交判断。
而第四种情况是,格子包围球有过半的体积在大球内部。那么我们可以用大球的球心,与格子包围球球面所构成的切线方向,来形成一个球面角。然后用该球面角与圆锥体的球面角进行相交判断。
通过以上四种情况的讨论,便可以很精确地判断出聚光灯和格子的求交情况了。
接下来,是Grid Shading在实际场景当中的应用。
右边这张图,是在比赛场景里放置的一个路灯,以及车辆本身的前置灯二者所构成的光照情况;左边这张图是关于该场景的灯光索引图。
怎么看这张索引图呢?通过观察发现,灯光索引图从上往下分为4层,对应到网格当中便是4层不同高度的网格。
另外,每个像素是一个格子。
如果,该像素里有颜色,则代表这个格子受到了灯光影响。从索引图中可看到,出现的蓝色区域是聚光灯所覆盖到的范围。该范围从上往下是逐渐增大的,那么也就对应了聚光灯上小下大的圆锥体形状。证明索引图的结果与场景完全对应。
因此,我们在实际绘制时,就可以采样这张索引图来判断像素所对应的灯光到底是哪些了。
最后,来比较一下Grid Shading和另外两种方案的区别。
首先在PreZ Pass阶段,对于Grid Shading而言是完全不需要该阶段的,而另外两种方案对该阶段则无法避免。这能够为我们节省很多Draw Call和Pass。
在求交计算方面,Grid Shading完全可以放在CPU层面去进行,并且计算过程非常简单,所得到的圆锥体相交结果也非常精确。但另外两种方案不仅无法放在CPU层进行计算,且计算过程比较复杂。在面对聚光灯时,计算结果也不够精确。
从划分颗粒度方面来看,Grid Shading是一个能够划分得非常精细的方案,Clustered Shading由于在Z轴上有更进一步的划分,因此相对来说也比较精细。但Tile Shading它是一个屏幕划分,所以划分的颗粒度非常粗。
所以可看到在以上几个方向上,Grid Shading非常有优势,并且在移动端上它的性能非常可以接受。就算在终端机上,求交计算过程中的开销也不超过1ms。
Grid Shading的问题在于,它需要一个平铺的水平视野范围。但对于赛车游戏而言,玩家的视野范围也正好是平铺的且处于水平方向。所以,这个限制对于我们来说并没有太大影响。
因此,Grid Shading可以说是一个非常适用于赛车游戏的多光源方案。
二、实时环境捕捉
首先来看一个效果演示。
在演示场景中有非常多的高亮物体,比如烟花。那么可以看到,在夜晚或者灯光比较暗的场景下,这种高亮物体对场景的影响甚至比直接光照所带来的影响更大一点。
反应在演示中就是,赛车和路面是可以被烟花这种物体所照亮的,而且赛车同时还会受到路面以及周围物体反弹的间接光影响。那么为了达成这种环境的光照效果,最重要的一步就是实时环境捕捉。
在移动端通常采用的是一种叫做“双抛物面映射”的方案。
它的思路是,将360°的环境通过两个抛物面映射到上和下两个方向上,通过两张图来表达整个场景的信息。
右边这张图就是我们在游戏里面捕捉到的两张双抛物面贴图。赛车和赛道都必须要去采样这两张贴图来获取环境信息。
为什么要采用这种双抛物面的映射方案呢?以下是我们对于几种不同环境捕捉方案的比较,相信通过比较便能得出结果。
一般来说全场景捕捉有三种方案,分别是“球面映射”、“立方体映射”和“双抛物面映射”。
在渲染目标数方面看,三者渲染的目标分别是1张、6张、2张。渲染数目越多代表需要更多的Pass以及Draw Call。
在畸变层面来说,球面映射会有一个非常大的畸变,且越是在边缘处畸变越大;立方体映射完全不存在畸变,双抛物面映射虽然也有畸变,但比较小,是可以接受的。
从映射质量来说,球面映射在边缘处的映射质量非常差,并且有奇点;立方体映射的信息量最大,所以映射质量是最高的;而双抛物面映射的映射质量一般,但在移动端仍可以接受。
从计算复杂度上看,我们需要对顶点做映射变换。因此球面映射的映射变换最为复杂,因为它需要用到开方运算;而立方体映射由于只是一个简单的透视映射,所以相对简单;同样,双抛物面映射的映射变换也比较简单。
那么,综合来看,双抛物面映射是非常适合用于移动端的环境捕捉方案。
在捕捉方向的选择上,我们可以选择前后捕捉、左右捕捉或者上下捕捉。如果选择前后捕捉或者左右捕捉这种方案,由于场景是平铺的,因而赛道在这种划分方向上会出现三角面的裁剪。最后在合成环境图时就会有裂缝,这对我们来说是不可以接受的。
如果采用上下方向去捕捉呢?虽然也有三角面的裁剪,但裁剪的位置非常远,玩家很难注意到。最后合成出来的环境光照也非常完整。
除了对捕捉方向的选择外,还需要对捕捉点的位置进行选择。
首先来看一张图,左边这个是湿滑路面的反射效果。大家可以看到这个路面反射有什么问题吗?很容易注意到的是,路面反射与实际场景的位置是不对应的。再来看这张图,右边这张图看起来就好多了。两张图为什么会有这样的区别呢?
我们将相机位置给大家展示一下,左边这张图我们可以看到,朝前的相机是游戏视角相机,朝上和朝下的相机是环境捕捉相机。捕捉相机和游戏视角相机并不在同一个位置上,这就导致了画面中位置不对齐的现象。
我们可以看到右上角的示意图。当我们的捕捉点与相机在垂直方向上不一致时,它们在对于用一个反射方向,所捕捉到信息在横向上是有差异的。如果捕捉点与相机在同一个垂直方向上,那么捕捉到的信息只会在纵向上有一定差异,但在横向上是对齐的。
也可以看到左边这张图,虽然在纵向上有差异,但玩家很难注意到。可如果在横向上有差异,玩家就会非常容易观察到这个现象。
不过,这又带来一个新的问题,如果想要保证车辆的反射正确,就必须将捕捉相机的位置放在车的附近。但在游戏中,游戏视角相机与车辆本身的位置是有一定差异的。
所以我们没办法保证地面反射与车辆反射处于同时精准的状态,二者只能选其一。可是对于玩家而言,很难注意到车辆反射的不准确性,而是更容易注意到地面反射的不准确性。
因此我们会将捕捉相机与游戏视角相机放在同一位置,这样来确保地面反射的准确性。
在捕捉完场景之后,需要在IBL里面采样这两个捕捉内容来生成环境贴图。但IBL有一个要求,即在粗糙度比较高的情况下,它需要对环境贴图进行滤波。
原本我们直接对双抛物面的捕捉结果进行动态生成Mipmap,来近似这个滤波之后的环境贴图。但这样会带来一个问题,如下图。
图中是一个带有粗糙度的球体,它的上下半球之间有明显的分界线,这是怎么回事呢?
这是因为在捕捉时,朝上的半球受到的光照强度比较高,朝下的半球光照比较弱。在滤波时Mipmap只能对一张贴图进行Mipmap,没办法对整个环境进行混合。因此就带来了上下半球亮度不统一的现象。
怎样解决这个问题呢?我们又回想到了球面映射方案。因为球面映射是一整张贴图,所以对它生成Mipmap时,可以对全场进行滤波。于是,可以把双抛物面捕捉到的结果通过球面映射合成到一张贴图上。
此外,为了减少纹理的绑定及采样,还可以把双抛物面的两个捕捉内容分别放在同一个纹理的不同Mip上,这样就能减少一部分开销。
接下来,我们来看一下双抛物面捕捉的流程。
首先,为了减少Pass和Draw Call,会把上下半球的捕捉分成两个阶段进行。一帧捕捉上半球,一帧捕捉下半球,两帧交替进行。这样每一帧只需采样一个半球便可。
采样到环境之后,再把它用球面映射的方式合成到一张贴图上,接着再生成Mipmap。最后绘制阶段,把它应用到场景像素的绘制中。
那么,在室外场景下看,这样的表现是非常好的。但是,当我们把车开进隧道之后,又出现了一个新的问题。
如右边这张图,这是一辆白色的918,但在进入隧道后,它就变成一辆黑色的车了。这是为什么呢?原因是我们在隧道中捕捉的场景非常暗,它缺少静态光信息。
这时,就需要去获取静态光信息。那静态光信息到底存放在哪里呢?它存在于我们的光照探针里,所以就需要从光照探针里获取更多的信息来进行渲染。
一般来说,间接光分为Diffuse和Specular两个部分。Diffuse是在游戏里通过求些系数的光照探针来表示的。它是一个预烘焙后的包含静态光的信息。而Specular则是实时捕捉的内容。
在粗糙度变大的时候,需要把Specular向Diffuse的辐照度去靠拢。那么如何实现呢?UE4其实已经做了类似的流程,但那只是针对静态的一个方案。我们将这套流程进行了改进来适用于动态捕捉。
计算分为两阶段。首先在Vertex阶段,需要对这个球面映射的内容采取它最高级的Mips,并且将这个像素的内容点乘(0.3,0.59,0.11)。这是RGB各个通道的亮度权重值。
通过上面就得可以到环境的平均亮度。在Pixel阶段,用Diffuse辐照度除以平均亮度,并用粗糙度在1.0到刚刚计算出来的这个数值之间做插值。然后将这个插值乘以Specular,这样就能让Specular的亮度进行提高,达到跟环境一致的效果。
那么这样看来,在隧道中汽车原本的颜色也能回来了,并且它的效果也跟周围的环境比较统一。这就是全局光照的一个表现。
在讲完了实时环境捕捉以及实时多光源后,把这两者结合起来,看看在游戏里的实际效果。
三、总结
最后,我们来做一个技术的展望。
我们这套方案可以用于实时环境光照变化比较剧烈的场景,对于光源高频变化具有较好的适应性。除了赛车游戏之外,还可以用于不同游戏类型,比如说MMORPG、FPS等等。
未来,我们还将会把这套方案延展到大世界以及昼夜变换和天气系统中。另外还计划玩家自定义赛道,这就意味着需要去实时捕捉环境间接光Diffuse的光照,这也是我们目前正在研究的一个方向。
这就是我演讲的全部内容,谢谢大家!
N.GAME是由网易互娱学习发展举办的一年一度行业交流盛事,至今已成功举办七届。本届主题为“未来已来The Future is Now”,邀请了20位海内外重磅嘉宾、高校学者汇聚一堂,共享行业研发经验、前沿研究成果和未来发展趋势。
* 文章经作者授权发布,不代表『游戏日报』立场,如需转载请联系原作者。