欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

程序员文章站 2022-05-23 19:51:24
前言 上一章我们知道了如何使用几何着色器将顶点通过流输出阶段输出到绑定的顶点缓冲区。接下来我们继续利用它来实现一些新的效果,在这一章,你将了解: 1. 实现公告板效果 2. Alpha To Coverage 3. 对GPU资源进行读/写操作 4. 纹理数组 5. 实现雾效 "DirectX11 W ......

前言

上一章我们知道了如何使用几何着色器将顶点通过流输出阶段输出到绑定的顶点缓冲区。接下来我们继续利用它来实现一些新的效果,在这一章,你将了解:

  1. 实现公告板效果
  2. alpha-to-coverage
  3. 对gpu资源进行读/写操作
  4. 纹理数组
  5. 实现雾效

directx11 with windows sdk完整目录

github项目源码

实现雾效

虽然这部分与几何着色器并没有什么关系,但是雾的效果在该demo中会用到,并且前面也没有讲过这部分内容,故先在这里提出来。

有时候我们需要在游戏中模拟一些特定的天气条件,比如说大雾。它可以让物体平滑出现而不是突然蹦出来那样(物体的一部分留在视锥体内使得只能看到该部分,然后在逐渐靠近该物体的时候,该物体就像经过了一个无形的扫描门被逐渐构造出来那样)。通过让雾在某一范围内具有一定的层次(让不可见区域比视锥体裁剪区域还近),我们可以避免上面所说的情况。但即便是晴朗的天气,你可能仍希望包含一个较广范围的雾效,即距离达到很远的地方才逐渐看不清物体。

我们可以使用这种方式来实现雾效:指定雾的颜色,以摄像机为原点的雾开始的最小距离,雾效范围值(超过起始距离+雾效范围值的范围外的颜色皆被指定的雾色取代)。在需要绘制的三角形内,某一像素片元的颜色如下:
\(\begin{align} foggedcolor &= litcolor + s(fogcolor - litcolor)\\ &= (1-s) \cdot litcolor + s \cdot fogcolor\\ \end{align}\)

该函数对应hlsl中的lerp函数,s取0的时候最终颜色为litcolor,然后逐渐增大并逼近1的时候,最终颜色就逐渐趋近于fogcolor。然后参数s的值取决于下面的函数:
\(s = saturate(\frac{dist(\mathbf{p},\mathbf{e}) - fogstart}{fogrange})\)
\(saturate(x) = \begin{cases} x, 0 \le x \le 1\\ 0, x < 0\\ 1, x > 1\\ \end{cases}\)

其中dist(p,e)指的是两点之间的距离值。配合下面的图去理解:
DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

还有注意一点,在每次清空重新绘制的时候,要用雾的颜色进行清空。

hlsl代码

与雾效相关的值存储在下面的常量缓冲区中,并且绘制3d物体的顶点没有发生变化:

// basic.fx
// ...

cbuffer cbdrawingstates : register(b2)
{
    float4 gfogcolor;
    int gfogenabled;
    float gfogstart;
    float gfogrange;
}

// ...
struct vertex3din
{
    float3 posl : position;
    float3 normall : normal;
    float2 tex : texcoord;
};

struct vertex3dout
{
    float4 posh : sv_position;
    float3 posw : position; // 在世界中的位置
    float3 normalw : normal; // 法向量在世界中的方向
    float2 tex : texcoord;
};

basic_vs_3d.hlsl也与之前一样,没有什么变动:

// basic_vs_3d.hlsl
#include "basic.fx"

// 顶点着色器(3d)
vertex3dout vs_3d(vertex3din pin)
{
    vertex3dout pout;
    
    row_major matrix worldviewproj = mul(mul(gworld, gview), gproj);
    pout.posh = mul(float4(pin.posl, 1.0f), worldviewproj);
    pout.posw = mul(float4(pin.posl, 1.0f), gworld).xyz;
    pout.normalw = mul(pin.normall, (float3x3) gworldinvtranspose);
    pout.tex = mul(float4(pin.tex, 0.0f, 1.0f), gtextransform).xy;
    return pout;
}

basic_ps_3d.hlsl现在使用了4盏方向光以保证4种不同方向的光能够均匀照射,并添加了雾效部分的处理:

// basic_ps_3d.hlsl
#include "basic.fx"

// 像素着色器(3d)
float4 ps_3d(vertex3dout pin) : sv_target
{
    // 提前进行裁剪,对不符合要求的像素可以避免后续运算
    float4 texcolor = tex.sample(sam, pin.tex);
    clip(texcolor.a - 0.05f);

    // 标准化法向量
    pin.normalw = normalize(pin.normalw);

    // 求出顶点指向眼睛的向量,以及顶点与眼睛的距离
    float3 toeyew = normalize(geyeposw - pin.posw);
    float disttoeye = distance(geyeposw, pin.posw);

    // 初始化为0 
    float4 ambient = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 diffuse = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 spec = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 a = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 d = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 s = float4(0.0f, 0.0f, 0.0f, 0.0f);

    [unroll]
    for (int i = 0; i < 4; ++i)
    {
        computedirectionallight(gmaterial, gdirlight[i], pin.normalw, toeyew, a, d, s);
        ambient += a;
        diffuse += d;
        spec += s;
    }
    
    float4 litcolor = texcolor * (ambient + diffuse) + spec;

    // 雾效部分
    [flatten]
    if (gfogenabled)
    {
        // 限定在0.0f到1.0f范围
        float foglerp = saturate((disttoeye - gfogstart) / gfogrange);
        // 根据雾色和光照颜色进行线性插值
        litcolor = lerp(litcolor, gfogcolor, foglerp);
    }

    litcolor.a = texcolor.a * gmaterial.diffuse.a;
    return litcolor;
}

对于白天来说,我们可以使用rgba=(0.75f, 0.75f, 0.75f, 1.0f)来作为雾的颜色。

而对于黑夜来说,这个雾效更像是战争迷雾的效果,我们使用rgba=(0.0f, 0.0f, 0.0f, 1.0f)来作为雾的颜色,这样远处的物体我们就让它看不见,而在可视范围内,距离越远的物体能见度越低。

具体的演示效果在最后可以看到。

树的公告板效果

当一棵树离摄像机太远的话,我们可以使用公告板技术,用一张树的贴图来进行绘制,取代原来绘制3d树模型的方式。首先我们给出树的纹理贴图组成:
DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

关注alpha通道部分,白色区域指代alpha值为1.0(完全不透明),而黑色区域指代alpha值0.0(完全透明)。所以在渲染树纹理的时候,我们只需要对alpha值为0.0的像素区域进行裁剪即可。

实现公告板的关键点在于:公告板要永远正向摄像机(即视线要与公告板表面垂直),使得用户的视线在x0z面上的投影一直与贴图表面垂直。这样做省去了大量顶点的输入和处理,显得更加高效,并且这个小技巧还能够欺骗玩家让人误以为还是原来的3d模型(眼尖的玩家还是有可能认得出来),只要你别一开始就告诉人家这棵树的绘制用了公告板原理就行了(→_→)。

现在不考虑坐标系的y轴部分(即从上方俯视),从下面的图可以看到,公告板投影的中心部分的法向量是直接指向摄像机的。

DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

因此我们可以得到公告板的u轴, v轴和w轴单位向量以及根据公告板构建的局部坐标系:
\(\mathbf{w}=\frac{(e_x-c_x,0,e_z-c_z)}{e_x-c_x,0,e_z-c_z}\)
\(\mathbf{v}=(0,1,0)\)
\(\mathbf{u}=\mathbf{v}\times\mathbf{w}\)

然后已知中心顶点位置、树宽度和高度,就可以求得2d树矩形的四个顶点了:

// 计算出公告板矩形的四个顶点
//            up
//       v1___|___v3
//        |   |   |
// right__|___|   |
//        |__/____|
//       v0 /     v2
//        look  
v[0] = float4(center + halfwidth * right - halfheight * up, 1.0f);
v[1] = float4(center + halfwidth * right + halfheight * up, 1.0f);
v[2] = float4(center - halfwidth * right - halfheight * up, 1.0f);
v[3] = float4(center - halfwidth * right + halfheight * up, 1.0f);

注意上面的加减运算是针对float3进行的,然后用1.0f填充成4d向量。并且由于每个公告板所处的局部坐标系不一样,我们需要对它们分别计算出对应的坐标轴向量。

若现在我们需要绘制公告板,则在输入的时候仅提供对应的中心顶点,然后图元类型选择d3d11_primitive_topology_pointlist,在几何着色阶段我们直接将顶点直传到几何着色阶段,这些顶点传递给几何着色器后就会解释成一个个矩形(两个三角形),产生公告板。

hlsl代码

下面是basic.fx的完整代码:

// basic.fx

#include "lighthelper.hlsli"

texture2d tex : register(t0);
texture2darray texarray : register(t1);
samplerstate sam : register(s0);


cbuffer cbchangeseverydrawing : register(b0)
{
    row_major matrix gworld;
    row_major matrix gworldinvtranspose;
    row_major matrix gtextransform;
    material gmaterial;
}

cbuffer cbchangeseveryframe : register(b1)
{
    row_major matrix gview;
    float3 geyeposw;
}

cbuffer cbdrawingstates : register(b2)
{
    float4 gfogcolor;
    int gfogenabled;
    float gfogstart;
    float gfogrange;
}

cbuffer cbchangesonresize : register(b3)
{
    row_major matrix gproj;
}

cbuffer cbneverchange : register(b4)
{
    directionallight gdirlight[4];
}



struct vertex3din
{
    float3 posl : position;
    float3 normall : normal;
    float2 tex : texcoord;
};

struct vertex3dout
{
    float4 posh : sv_position;
    float3 posw : position; // 在世界中的位置
    float3 normalw : normal; // 法向量在世界中的方向
    float2 tex : texcoord;
};

struct pointsprite
{
    float3 posw : position;
    float2 sizew : size;
};

struct billboardvertex
{
    float4 posh : sv_position;
    float3 posw : position;
    float3 normalw : normal;
    float2 tex : texcoord;
    uint primid : sv_primitiveid;
};

对于顶点着色器,仅负责顶点的直传:

// billboard_vs.hlsl

#include "basic.fx"

pointsprite vs(pointsprite pin)
{
    return pin;
}

而几何着色器的代码如下:

// billboard_gs.hlsl

#include "basic.fx"

// 节省内存资源,先用float4向量声明。
static const float4 gvec[2] = { float4(0.0f, 1.0f, 0.0f, 0.0f), float4(1.0f, 1.0f, 1.0f, 0.0f) };
static const float2 gtex[4] = (float2[4])gvec;

[maxvertexcount(4)]
void gs(point pointsprite input[1], uint primid : sv_primitiveid, 
    inout trianglestream<billboardvertex> output)
{
    // 计算公告板所处的局部坐标系,其中公告板相当于
    // 被投影在了局部坐标系的xy平面,z轴

    float3 up = float3(0.0f, 1.0f, 0.0f);
    float3 look = geyeposw - input[0].posw;
    look.y = 0.0f;  // look向量只取投影到xz平面的向量
    look = normalize(look);
    float3 right = cross(up, look);

    // 计算出公告板矩形的四个顶点
    //            up
    //      v1 ___|___ v3
    //        |   |   |
    // right__|___|   |
    //        |  /    |
    //        |_/_____|
    //      v0 /       v2
    //       look  
    float4 v[4];
    float3 center = input[0].posw;
    float halfwidth = 0.5f * input[0].sizew.x;
    float halfheight = 0.5f * input[0].sizew.y;
    v[0] = float4(center + halfwidth * right - halfheight * up, 1.0f);
    v[1] = float4(center + halfwidth * right + halfheight * up, 1.0f);
    v[2] = float4(center - halfwidth * right - halfheight * up, 1.0f);
    v[3] = float4(center - halfwidth * right + halfheight * up, 1.0f);

    // 对顶点位置进行矩阵变换,并以trianglestrip形式输出
    billboardvertex gout;
    row_major matrix viewproj = mul(gview, gproj);
    [unroll]
    for (int i = 0; i < 4; ++i)
    {
        gout.posw = v[i].xyz;
        gout.posh = mul(v[i], viewproj);
        gout.normalw = look;
        gout.tex = gtex[i];
        gout.primid = primid;
        output.append(gout);
    }

}

首先一开始不用float2数组是因为每个float2元素会单独打包,浪费了一半的空间,因此这里采取一种特殊的语法形式使得内存可以得到充分利用。

然后要注意maxvertexcount的值要设为4,尽管append的次数为4,但实际上输出的三角形顶点数为6。

图元id

现在讲述系统值sv_primitiveid,我们可以将它作为函数的额外形参进行提供。它告诉我们在输入装配阶段下自动分配的图元id值。当我们调用了一个draw方法,需要绘制n个图元,那么第一个图元对应的id值为0,第二个为1,直到最后一个为n-1.当前的所有图元id仅在当前的单次调用绘制是唯一的。其中该系统值的写入操作允许在几何着色器和像素着色器进行,而读取操作则允许在几何/像素/外壳/域着色器中进行。

在上面的例子中,我们将一个顶点产生的矩形四个顶点都标记为同一个图元id,是因为到后续的像素着色器中,我们用该图元id映射到纹理数组的索引值,来对应到要绘制的树的纹理。

注意: 如果几何着色器没有提供图元id,在像素着色器中也可以将它加进参数列表中以使用:

float4 ps(vertex3dout pin, uint primid : sv_primitiveid) : sv_target
{
// pixel shader body…
}

但如果像素着色器提供了图元id,渲染管线又绑定了几何着色器,则几何着色器必须提供该参数。在几何着色器中你可以使用或修改图元id值。

顶点id

紧接着是系统值sv_vertexid,在输入装配阶段的时候渲染管线就会为这些输入的顶点分配顶点id值。若使用的是draw方法,则这些顶点将会按顺序从0到n-1被标记(n为顶点数目);若使用的是drawindexed方法,则顶点id对应到的是该顶点所处的索引值。该参数仅能在顶点着色器的参数列表中提供:

vertexout vs(vertexin vin, uint vertid : sv_vertexid)
{
// vertex shader body…
}

最后给出像素着色器的代码:

// billboard_ps.hlsl

#include "basic.fx"

float4 ps(billboardvertex pin) : sv_target
{
    // 每4棵树一个循环,尽量保证出现不同的树
    float4 texcolor = texarray.sample(sam, float3(pin.tex, pin.primid % 4));
    // 提前进行裁剪,对不符合要求的像素可以避免后续运算
    clip(texcolor.a - 0.05f);

    // 标准化法向量
    pin.normalw = normalize(pin.normalw);

    // 求出顶点指向眼睛的向量,以及顶点与眼睛的距离
    float3 toeyew = normalize(geyeposw - pin.posw);
    float disttoeye = distance(geyeposw, pin.posw);

    // 初始化为0 
    float4 ambient = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 diffuse = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 spec = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 a = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 d = float4(0.0f, 0.0f, 0.0f, 0.0f);
    float4 s = float4(0.0f, 0.0f, 0.0f, 0.0f);

    [unroll]
    for (int i = 0; i < 4; ++i)
    {
        computedirectionallight(gmaterial, gdirlight[i], pin.normalw, toeyew, a, d, s);
        ambient += a;
        diffuse += d;
        spec += s;
    }

    float4 litcolor = texcolor * (ambient + diffuse) + spec;

    // 雾效部分
    [flatten]
    if (gfogenabled)
    {
        // 限定在0.0f到1.0f范围
        float foglerp = saturate((disttoeye - gfogstart) / gfogrange);
        // 根据雾色和光照颜色进行线性插值
        litcolor = lerp(litcolor, gfogcolor, foglerp);
    }

    litcolor.a = texcolor.a * gmaterial.diffuse.a;
    return litcolor;
}

这里加上了刚才的雾效,并使用了纹理数组。

纹理数组

之前在c++代码层中,我们的每一张纹理使用id3d11texture2d的接口对象去单独存储。但实际上在我们创建id3d11texture2d对象的时候,我们可以设置它的arraysize来指定该对象可以存放的纹理数目。

但是我们创建纹理并不是使用d3dx系列的函数,因为我们根本就不使用directx sdk。在之前我们创建纹理使用的是ddstextureloader.hwictextureloader.h中的函数。这里再提及一下,这两个头文件对应的库可以在下面两个途径找到:

directxtex

directxtk

回到hlsl代码,我们之所以不使用下面的这种形式创建纹理数组:

texture2d texarray[4];

float4 ps(geoout pin) : sv_target
{
    float4 c = texarray[pin.primid%4].sample(samlinear, pin.tex);

是因为这样做的话hlsl编译器会报错:sampler array index must be a literal experssion,即pin.primid的值也必须是个字面值,而不是变量。但我们还是想要能够根据变量取对应纹理的能力。

正确的做法应当是声明一个texture2darray的数组:

texture2darray texarray : register(t1);

这里使用的是索引为1的纹理寄存器是因为前面还有一个纹理已经绑定了t0.

纹理数组的采样

texture2darray同样也具有sample方法:

// 每4棵树一个循环,尽量保证出现不同的树
float4 texcolor = texarray.sample(sam, float3(pin.tex, pin.primid % 4));

第一个参数依然是采样器

而第二个参数则是一个3d向量,其中x与y的值对应的还是纹理坐标,而z分量即便是个float,主要是用于作为索引值选取纹理数组中的某一个具体纹理。同理索引值0对应纹理数组的第一张纹理,1对应的是第二张纹理等等...

在我们的这个demo中,纹理数组存放了4张不同样式的树的纹理贴图,然后用sv_primitive模4的值来决定哪张树纹理贴图将被绘制。

DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

使用纹理数组的优势是,我们可以一次性预先创建好所有需要用到的纹理,并绑定到hlsl的纹理数组中,而不需要每次都重新绑定一个纹理。然后我们再使用索引值来访问纹理数组中的某一纹理。

纹理数组的加载

现在我们手头上仅有的就是ddstextureloader.hwictextureloader.h中的函数,但这里面的函数每次都只能加载一张纹理。我们还需要修改龙书样例中读取纹理的函数,具体的操作顺序如下:

  1. 一个个读取存有纹理的文件,创建出一系列id3d11texture2d对象,这里的每个对象单独包含一张纹理;
  2. 创建一个id3d11texture2d对象,它同时也是一个纹理数组;
  3. 将之前读取的所有纹理有条理地复制到刚创建的纹理数组对象中;
  4. 为该纹理数组对象创建创建一个纹理资源视图(shader resource view)。

首先我们需要了解增强版的纹理创建函数。

createddstexturefromfileex函数--使用更多的参数,从文件中读取dds纹理

hresult createddstexturefromfileex(
    id3d11device* d3ddevice,                // [in]d3d设备
    id3d11devicecontext* d3dcontext,        // [in]d3d设备上下文(可选)
    const wchar_t* szfilename,              // [in].dds文件名
    size_t maxsize,                         // [in]最大允许mipmap等级,默认0
    d3d11_usage usage,                      // [in]d3d11_usage枚举值类型,指定cpu/gpu读写权限
    unsigned int bindflags,                 // [in]绑定标签,指定它可以被绑定到什么对象上
    unsigned int cpuaccessflags,            // [in]cpu访问权限标签
    unsigned int miscflags,                 // [in]杂项标签,忽略
    bool forcesrgb,                         // [in]强制使用srgb,默认false
    id3d11resource** texture,               // [out]获取创建好的纹理(可选)
    id3d11shaderresourceview** textureview, // [out]获取创建好的纹理资源视图(可选)
    dds_alpha_mode* alphamode = nullptr);   // [out]忽略(可选)

也就是说,图片的数据格式、宽度、高度等信息都是随文件读取的时候获得的,我们无法在这里指定。所以我们要求提供的所有dds纹理宽度、高度、数据格式都应当一致。对于数据格式不一致的,我们可以使用directx texture tool来修改,但是该程序包含在directx sdk中,这里我在github上尝试提供单独的dxtex.exe程序看能不能直接使用。现在我预先确保demo中的4张树纹理都设置为同样的数据格式。

第一步,读取一系列纹理的代码如下:

//
// 1. 读取所有纹理
//
size_t size = filenames.size();
std::vector<comptr<id3d11texture2d>> srctex(size);
uint miplevel = maxmipmapsize;
uint width, height;
dxgi_format format;
for (size_t i = 0; i < size; ++i)
{
    // 由于这些纹理并不会被gpu使用,我们使用d3d11_usage_staging枚举值
    // 使得cpu可以读取资源
    hr(createddstexturefromfileex(device.get(),
        devicecontext.get(),
        filenames[i].c_str(),
        maxmipmapsize,
        d3d11_usage_staging,                            // usage
        0,                                              // bindflags
        d3d11_cpu_access_write | d3d11_cpu_access_read, // cpuaccessflags
        0,                                              // miscflags
        false,
        (id3d11resource**)srctex[i].getaddressof(),
        nullptr));

    // 读取创建好的纹理mipmap等级, 宽度和高度
    d3d11_texture2d_desc texdesc;
    srctex[i]->getdesc(&texdesc);
    if (i == 0)
    {
        miplevel = texdesc.miplevels;
        width = texdesc.width;
        height = texdesc.height;
        format = texdesc.format;
    }
    // 这里断言所有纹理的mipmap等级,宽度和高度应当一致
    assert(miplevel == texdesc.miplevels);
    assert(texdesc.width == width && texdesc.height == height);
    // 这里要求所有提供的图片数据格式应当是一致的,若存在不一致的情况,请
    // 使用dxtex.exe(directx texture tool)将所有的图片转成一致的数据格式
    assert(texdesc.format == format);
        
}

接下来的第二步就是创建纹理数组,我们使用第一个纹理的描述去填充纹理数组的一部分描述:

//
// 2.创建纹理数组
//
d3d11_texture2d_desc texdesc, texarraydesc;
srctex[0]->getdesc(&texdesc);
texarraydesc.width = texdesc.width;
texarraydesc.height = texdesc.height;
texarraydesc.miplevels = texdesc.miplevels;
texarraydesc.arraysize = size;
texarraydesc.format = texdesc.format;
texarraydesc.sampledesc.count = 1;
texarraydesc.sampledesc.quality = 0;
texarraydesc.usage = d3d11_usage_default;
texarraydesc.bindflags = d3d11_bind_shader_resource;
texarraydesc.cpuaccessflags = 0;
texarraydesc.miscflags = 0;

comptr<id3d11texture2d> texarray;
hr(device->createtexture2d(&texarraydesc, nullptr, texarray.getaddressof()));

在第三步进行复制之前,我们还需要了解纹理的子资源

纹理子资源(texture subresources)

wictextureloader或者ddstextureloader读取出来的纹理数据实际上并不是由单纯的一个二维数组构成,而是多个不同大小的二维数组,不同的mipmap等级对应不同的二维数组,这些二维数组都是该纹理的子资源。比如512x512的纹理加载进来包含的mipmap等级数(mipmap levels)为10,包含了从512x512, 256x256, 128x128...到1x1的10个二维数组颜色数据,而direct3d api使用mip切片(mip slice)来指定某一mipmap等级的纹理,也有点像索引。比如mip slice值为0时,对应的是512x512的纹理,而mip slice值1对应的是256x256,以此类推。

对于纹理数组,每个元素就上面说的单个纹理对应的mipmap链,direct3d api使用数组切片(array slice)来访问不同纹理,也是相当于索引.这样我们就可以把所有的纹理资源用下面的图来表示,假定下图有4个纹理,每个纹理包含3个子资源,则当前指定的是array slice为2,mip slice为1的子资源。

DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

d3d11calcsubresource函数--计算子资源的索引值

对于纹理数组的每一个子资源都可以用一个一维的索引值访问,索引值的增减是以mip切片值为主递增的。
DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

然后给定当前纹理数组的mipmap等级数(mipmap levels),数组切片(array slice)和mip切片(mip slice),我们就可以用下面的函数来求得指定子资源的索引值:

inline uint d3d11calcsubresource(uint mipslice, uint arrayslice, uint miplevels )
{ return mipslice + arrayslice * miplevels; }

然后是映射相关的两个函数

id3d11devicecontext::map函数--获取指向子资源中数据的指针并拒绝gpu对该子资源的访问

hresult id3d11devicecontext::map(
    id3d11resource           *presource,          // [in]包含id3d11resource接口的资源对象
    uint                     subresource,         // [in]子资源索引
    d3d11_map                maptype,             // [in]d3d11_map枚举值,指定读写相关操作
    uint                     mapflags,            // [in]填0,忽略
    d3d11_mapped_subresource *pmappedresource     // [out]获取到的已经映射到内存的子资源
);

d3d11_map枚举值类型的成员如下:

d3d11_map成员 含义
d3d11_map_read 映射到内存的资源用于读取。该资源在创建的时候必须绑定了
d3d11_cpu_access_read标签
d3d11_map_write 映射到内存的资源用于写入。该资源在创建的时候必须绑定了
d3d11_cpu_access_write标签
d3d11_map_read_write 映射到内存的资源用于读写。该资源在创建的时候必须绑定了
d3d11_cpu_access_read和d3d11_cpu_access_write标签
d3d11_map_write_discard 映射到内存的资源用于写入,之前的资源数据将会被抛弃。该
资源在创建的时候必须绑定了d3d11_cpu_access_write和d3d11_usage_dynamic标签
d3d11_map_write_no_overwrite 映射到内存的资源用于写入,但不能复写已经存在的资源。
该枚举值只能用于顶点/索引缓冲区。该资源在创建的时候需要有d3d11_cpu_access_write标签,在direct3d 11不能用于
设置了d3d11_bind_constant_buffer标签的资源,但在11.1后可以。具体可以查阅msdn文档

id3d11devicecontext::unmap函数--让指向资源的指针无效并重新启用gpu对该资源的访问权限

void id3d11devicecontext::unmap(
    id3d11resource *presource,      // [in]包含id3d11resource接口的资源对象
    uint           subresource      // [in]需要取消的子资源索引
);

第三步的具体代码如下:

//
// 3.将所有的纹理子资源赋值到纹理数组中
//

// 每个纹理元素
for (size_t i = 0; i < size; ++i)
{
    // 纹理中的每个mipmap等级
    for (uint j = 0; j < miplevel; ++j)
    {
        d3d11_mapped_subresource mappedtex2d;
        // 允许映射索引i纹理中,索引j的mipmap等级的2d纹理
        hr(devicecontext->map(srctex[i].get(),
            j, d3d11_map_read, 0, &mappedtex2d));
        devicecontext->updatesubresource(
            texarray.get(),
            d3d11calcsubresource(j, i, miplevel),   // i * miplevel + j
            nullptr,
            mappedtex2d.pdata,
            mappedtex2d.rowpitch,
            mappedtex2d.depthpitch);
        // 停止映射
        devicecontext->unmap(srctex[i].get(), j);
    }
}

最后一步就是要创建着色器资源视图。

id3d11device::createshaderresourceview--创建着色器资源视图

hresult id3d11device::createshaderresourceview(
    id3d11resource                        *presource,   // [in]待绑定资源
    const d3d11_shader_resource_view_desc *pdesc,       // [in]着色器资源视图描述
    id3d11shaderresourceview              **ppsrview    // [out]获取创建的着色器资源视图
);

所以还需要填充d3d11_shader_resource_view_desc结构体:

typedef struct d3d11_shader_resource_view_desc
{
    dxgi_format format;     // 数据格式
    d3d11_srv_dimension viewdimension;  // 视图维度,决定下面需要填充哪个共用体成员
    union 
    {
        d3d11_buffer_srv buffer;
        d3d11_tex1d_srv texture1d;
        d3d11_tex1d_array_srv texture1darray;
        d3d11_tex2d_srv texture2d;
        d3d11_tex2d_array_srv texture2darray;
        d3d11_tex2dms_srv texture2dms;
        d3d11_tex2dms_array_srv texture2dmsarray;
        d3d11_tex3d_srv texture3d;
        d3d11_texcube_srv texturecube;
        d3d11_texcube_array_srv texturecubearray;
        d3d11_bufferex_srv bufferex;
    };
}   d3d11_shader_resource_view_desc;

最后一步的代码如下:

//
// 4.创建纹理数组的srv
//
d3d11_shader_resource_view_desc viewdesc;
viewdesc.format = texarraydesc.format;
viewdesc.viewdimension = d3d11_srv_dimension_texture2darray;
viewdesc.texture2darray.mostdetailedmip = 0;
viewdesc.texture2darray.miplevels = texarraydesc.miplevels;
viewdesc.texture2darray.firstarrayslice = 0;
viewdesc.texture2darray.arraysize = size;

comptr<id3d11shaderresourceview> texarraysrv;
hr(device->createshaderresourceview(texarray.get(), &viewdesc, texarraysrv.getaddressof()));

// 已经确保所有资源由comptr管理,无需手动释放

return texarraysrv;

createddstexture2darrayshaderresourceview函数--创建用于dds纹理的数组着色器资源视图

该函数放到了gameapp类中,你也可以单独抽离出来。

comptr<id3d11shaderresourceview> createddstexture2darrayshaderresourceview(
    comptr<id3d11device> device,                    // [in]d3d设备
    comptr<id3d11devicecontext> devicecontext,      // [in]d3d设备上下文
    const std::vector<std::wstring>& filenames,     // [in]文件名数组
    int maxmipmapsize);    // [in]最大允许mipmap等级,若为0,则使用默认纹理mipmap等级

具体的函数实现就是上面四步的所有代码。

alpha-to-coverage

在demo运行的时候,仔细观察可以发现树公告板的某些边缘部分有一些比较突出的黑边。

这是因为当前默认使用的是alpha test,即hlsl中使用clip函数将alpha值为0的像素点给剔除掉,这些像素也不是树的一部分。该函数决定某一像素是留下还是抛弃,这会导致不平滑的过渡现象,在摄像机逐渐靠近该纹理时,图片本身也在不断放大,硬边部分也会被放大,就像下面那张图:

DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

当然,你也可以使用透明混合的方式,但是透明混合对绘制的顺序是有要求的,要求透明物体按从后到前的顺序进行绘制,即需要在绘制透明物体前先对物体按到摄像机的距离排个序。当然如果需要绘制大量的草丛的话,这种方法所需要的开销会变得非常大,操作起来也十分麻烦。

当然,我们可以考虑下使用msaa(多重采样抗锯齿),并配合alpha test进行。msaa可以用于将多边形的锯齿边缘平滑处理,然后让direct3d开启alpha-to-coverage技术,标记边缘部分。

首先在创建后备缓冲区、深度/模板缓冲区的时候需要打开4倍多重采样的支持,我们只需要在gameapp的构造函数中这样写即可:

gameapp::gameapp(hinstance hinstance)
    : d3dapp(hinstance)
{
    // 开启4倍多重采样
    menable4xmsaa = true;
}

然后在之前的例子里,我们已经在renderstates类中预先创建好了混合状态:

d3d11_blend_desc blenddesc;
zeromemory(&blenddesc, sizeof(blenddesc));
auto& rtdesc = blenddesc.rendertarget[0];
// alpha-to-coverage模式
blenddesc.alphatocoverageenable = true;
blenddesc.independentblendenable = false;
rtdesc.blendenable = false;
rtdesc.rendertargetwritemask = d3d11_color_write_enable_all;
hr(device->createblendstate(&blenddesc, bsalphatocoverage.releaseandgetaddressof()));

然后只需要在需要的时候绑定该状态即可。

basicfx.h的变化

常量缓冲区对应的结构体和basicfx类的变化如下:

#ifndef basicfx_h
#define basicfx_h

#include <wrl/client.h>
#include <d3d11_1.h>
#include <d3dcompiler.h>
#include <directxmath.h>
#include <vector>
#include "lighthelper.h"
#include "renderstates.h"
#include "vertex.h"

// 由于常量缓冲区的创建需要是16字节的倍数,该函数可以返回合适的字节大小
inline uint align16bytes(uint size)
{
    return (size + 15) & (uint)(-16);
}

struct cbchangeseverydrawing
{
    directx::xmmatrix world;
    directx::xmmatrix worldinvtranspose;
    directx::xmmatrix textransform;
    material material;
};

struct cbchangeseveryframe
{
    directx::xmmatrix view;
    directx::xmfloat4 eyepos;
};

struct cbdrawingstates
{
    directx::xmfloat4 fogcolor;
    int fogenabled;
    float fogstart;
    float fogrange;
    float pad;
};

struct cbchangesonresize
{
    directx::xmmatrix proj;
};

struct cbneverchange
{
    directionallight dirlight[4];
};

class basicfx
{
public:
    // 使用模板别名(c++11)简化类型名
    template <class t>
    using comptr = microsoft::wrl::comptr<t>;

    // 初始化basix.fx所需资源并初始化光栅化状态
    bool initall(comptr<id3d11device> device);
    // 是否已经初始化
    bool isinit() const;

    template <class t>
    void updateconstantbuffer(const t& cbuffer);

    // 默认状态绘制
    void setrenderdefault();

    // 公告板绘制
    void setrenderbillboard(bool enablealphatocoverage);

private:
    // objfilenameinout为编译好的着色器二进制文件(.*so),若有指定则优先寻找该文件并读取
    // hlslfilename为着色器代码,若未找到着色器二进制文件则编译着色器代码
    // 编译成功后,若指定了objfilenameinout,则保存编译好的着色器二进制信息到该文件
    // ppblobout输出着色器二进制信息
    hresult createshaderfromfile(const wchar* objfilenameinout, const wchar* hlslfilename, lpcstr entrypoint, lpcstr shadermodel, id3dblob** ppblobout);

private:
    comptr<id3d11vertexshader> mbasicvs;
    comptr<id3d11pixelshader> mbasicps;

    comptr<id3d11vertexshader> mbillboardvs;
    comptr<id3d11geometryshader> mbillboardgs;
    comptr<id3d11pixelshader> mbillboardps;


    comptr<id3d11inputlayout> mvertexpossizelayout;         // 点精灵输入布局
    comptr<id3d11inputlayout> mvertexposnormaltexlayout;    // 3d顶点输入布局

    comptr<id3d11devicecontext> md3dimmediatecontext;       // 设备上下文

    std::vector<comptr<id3d11buffer>> mconstantbuffers;     // 常量缓冲区
};

#endif

初始化函数和setrenderdeafult方法这里就不赘述了。

basicfx::setrenderbillboard方法--公告板绘制

实现如下:

void basicfx::setrenderbillboard(bool enablealphatocoverage)
{
    md3dimmediatecontext->iasetprimitivetopology(d3d11_primitive_topology_pointlist);
    md3dimmediatecontext->iasetinputlayout(mvertexpossizelayout.get());
    md3dimmediatecontext->vssetshader(mbillboardvs.get(), nullptr, 0);
    md3dimmediatecontext->gssetshader(mbillboardgs.get(), nullptr, 0);
    md3dimmediatecontext->rssetstate(renderstates::rsnocull.get());
    md3dimmediatecontext->pssetshader(mbillboardps.get(), nullptr, 0);
    md3dimmediatecontext->pssetsamplers(0, 1, renderstates::sslinearwrap.getaddressof());
    md3dimmediatecontext->omsetdepthstencilstate(nullptr, 0);
    md3dimmediatecontext->omsetblendstate(
        (enablealphatocoverage ? renderstates::bsalphatocoverage.get() : nullptr),
        nullptr, 0xffffffff);
}

参数enablealphatocoverage决定是否要绑定渲染状态对象renderstates::bsalphatocoverage

gameapp类的变化

类成员相关声明如下:

class gameapp : public d3dapp
{
public:
    // 摄像机模式
    enum class cameramode { firstperson, thirdperson, free };
    
public:
    gameapp(hinstance hinstance);
    ~gameapp();

    bool init();
    void onresize();
    void updatescene(float dt);
    void drawscene();

private:
    bool initresource();
    void initpointspritesbuffer();

    // 根据给定的dds纹理文件集合,创建2d纹理数组
    // 要求所有纹理的宽度和高度都一致
    // 若maxmipmapsize为0,使用默认mipmap等级
    // 否则,mipmap等级将不会超过maxmipmapsize
    comptr<id3d11shaderresourceview> createddstexture2darrayshaderresourceview(
        comptr<id3d11device> device,
        comptr<id3d11devicecontext> devicecontext,
        const std::vector<std::wstring>& filenames,
        int maxmipmapsize = 0);


private:
    
    comptr<id2d1solidcolorbrush> mcolorbrush;               // 单色笔刷
    comptr<idwritefont> mfont;                              // 字体
    comptr<idwritetextformat> mtextformat;                  // 文本格式

    comptr<id3d11buffer> mpointspritesbuffer;               // 点精灵顶点缓冲区
    comptr<id3d11shaderresourceview> mtreetexarray;         // 树的纹理数组
    material mtreemat;                                      // 树的材质

    gameobject mground;                                     // 地面
    
    basicfx mbasicfx;                                       // basic特效管理类

    cameramode mcameramode;                                 // 摄像机模式
    std::shared_ptr<camera> mcamera;                        // 摄像机

    bool misnight;                                          // 是否黑夜
    bool menablealphatocoverage;                            // 是否开启alpha-to-coverage

    cbchangeseverydrawing mcbchangeseverydrawing;           // 该缓冲区存放每次绘制更新的变量
    cbchangeseveryframe mcbchangeseveryframe;               // 该缓冲区存放每帧更新的变量
    cbdrawingstates mcbdrawingstates;                       // 该缓冲区存放绘制状态
    cbchangesonresize mcbchangesonresize;                   // 该缓冲区存放仅在窗口大小变化时更新的变量
    cbneverchange mcbneverchange;                           // 该缓冲区存放不会再进行修改的变量
};

gameapp::initpointspritesbuffer方法--初始化存放点精灵的缓冲区

该方法会生成20个顶点,均匀并略带随机性地环绕在原点周围。这些顶点一经创建就不可以被修改了,它们将会被用于公告板的创建:

void gameapp::initpointspritesbuffer()
{
    srand((unsigned)time(nullptr));
    vertexpossize vertexes[16];
    float theta = 0.0f;
    for (int i = 0; i < 16; ++i)
    {
        // 取20-50的半径放置随机的树
        float radius = (float)(rand() % 31 + 20);
        float randomrad = rand() % 256 / 256.0f * xm_2pi / 16;
        vertexes[i].pos = xmfloat3(radius * cosf(theta + randomrad), 8.0f, radius * sinf(theta + randomrad));
        vertexes[i].size = xmfloat2(30.0f, 30.0f);
        theta += xm_2pi / 16;
    }

    // 设置顶点缓冲区描述
    d3d11_buffer_desc vbd;
    zeromemory(&vbd, sizeof(vbd));
    vbd.usage = d3d11_usage_immutable;  // 数据不可修改
    vbd.bytewidth = sizeof (vertexes);
    vbd.bindflags = d3d11_bind_vertex_buffer;
    vbd.cpuaccessflags = 0;
    // 新建顶点缓冲区
    d3d11_subresource_data initdata;
    zeromemory(&initdata, sizeof(initdata));
    initdata.psysmem = vertexes;
    hr(md3ddevice->createbuffer(&vbd, &initdata, mpointspritesbuffer.getaddressof()));
}

gameapp::initresource方法--初始化资源

该方法集成了所有资源的初始化,注意树的纹理数组要提供到输入槽1,对应纹理寄存器t1的texture2darray

bool gameapp::initresource()
{
    // 默认白天,开启alphatocoverage
    misnight = false;
    menablealphatocoverage = true;
    // ******************
    // 初始化各种物体

    // 初始化树纹理资源
    mtreetexarray = createddstexture2darrayshaderresourceview(
        md3ddevice,
        md3dimmediatecontext,
        std::vector<std::wstring>{
        l"texture\\tree0.dds",
            l"texture\\tree1.dds",
            l"texture\\tree2.dds",
            l"texture\\tree3.dds"});
    
    // 初始化点精灵缓冲区
    initpointspritesbuffer();

    // 初始化树的材质
    mtreemat.ambient = xmfloat4(0.5f, 0.5f, 0.5f, 1.0f);
    mtreemat.diffuse = xmfloat4(1.0f, 1.0f, 1.0f, 1.0f);
    mtreemat.specular = xmfloat4(0.2f, 0.2f, 0.2f, 16.0f);

    comptr<id3d11shaderresourceview> texture;
    // 初始化地板
    mground.setbuffer(md3ddevice, geometry::createplane(xmfloat3(0.0f, -5.0f, 0.0f), xmfloat2(100.0f, 100.0f), xmfloat2(10.0f, 10.0f)));
    hr(createddstexturefromfile(md3ddevice.get(), l"texture\\grass.dds", nullptr, texture.getaddressof()));
    mground.settexture(texture);
    material material;
    material.ambient = xmfloat4(0.5f, 0.5f, 0.5f, 1.0f);
    material.diffuse = xmfloat4(1.0f, 1.0f, 1.0f, 1.0f);
    material.specular = xmfloat4(0.2f, 0.2f, 0.2f, 16.0f);
    mground.setmaterial(material);
    mground.setworldmatrix(xmmatrixidentity());
    mground.settextransformmatrix(xmmatrixidentity());

    // ******************
    // 初始化常量缓冲区的值

    mcbchangeseverydrawing.material = mtreemat;
    mcbchangeseverydrawing.world = mcbchangeseverydrawing.worldinvtranspose = xmmatrixidentity();
    mcbchangeseverydrawing.textransform = xmmatrixidentity();


    // 方向光
    mcbneverchange.dirlight[0].ambient = xmfloat4(0.1f, 0.1f, 0.1f, 1.0f);
    mcbneverchange.dirlight[0].diffuse = xmfloat4(0.25f, 0.25f, 0.25f, 1.0f);
    mcbneverchange.dirlight[0].specular = xmfloat4(0.1f, 0.1f, 0.1f, 1.0f);
    mcbneverchange.dirlight[0].direction = xmfloat3(-0.577f, -0.577f, 0.577f);
    mcbneverchange.dirlight[1] = mcbneverchange.dirlight[0];
    mcbneverchange.dirlight[1].direction = xmfloat3(0.577f, -0.577f, 0.577f);
    mcbneverchange.dirlight[2] = mcbneverchange.dirlight[0];
    mcbneverchange.dirlight[2].direction = xmfloat3(0.577f, -0.577f, -0.577f);
    mcbneverchange.dirlight[3] = mcbneverchange.dirlight[0];
    mcbneverchange.dirlight[3].direction = xmfloat3(-0.577f, -0.577f, -0.577f);

    // 摄像机相关
    mcameramode = cameramode::free;
    auto camera = std::shared_ptr<firstpersoncamera>(new firstpersoncamera);
    mcamera = camera;
    camera->setposition(xmfloat3());
    camera->setfrustum(xm_pi / 3, aspectratio(), 1.0f, 1000.0f);
    camera->lookto(
        xmvectorset(0.0f, 0.0f, 0.0f, 1.0f),
        xmvectorset(0.0f, 0.0f, 1.0f, 1.0f),
        xmvectorset(0.0f, 1.0f, 0.0f, 0.0f));
    camera->updateviewmatrix();


    mcbchangeseveryframe.view = camera->getview();
    xmstorefloat4(&mcbchangeseveryframe.eyepos, camera->getpositionxm());

    mcbchangesonresize.proj = camera->getproj();
    
    // 雾状态默认开启
    mcbdrawingstates.fogenabled = 1;
    mcbdrawingstates.fogcolor = xmfloat4(0.75f, 0.75f, 0.75f, 1.0f);    // 银色
    mcbdrawingstates.fogrange = 75.0f;
    mcbdrawingstates.fogstart = 15.0f;
    // 更新常量缓冲区资源
    mbasicfx.updateconstantbuffer(mcbchangeseverydrawing);
    mbasicfx.updateconstantbuffer(mcbchangeseveryframe);
    mbasicfx.updateconstantbuffer(mcbchangesonresize);
    mbasicfx.updateconstantbuffer(mcbdrawingstates);
    mbasicfx.updateconstantbuffer(mcbneverchange);

    // 直接绑定树的纹理
    md3dimmediatecontext->pssetshaderresources(1, 1, mtreetexarray.getaddressof());
    
    return true;
}

其余方法限于篇幅就不放在这里了,读者可以查看源码观察剩余部分的代码实现。现在来看实现效果吧。

实现效果

可以观察到,在与公告版近距离接触时可以很明显地看到公告板在跟着摄像机旋转。如果距离很远的话转动的幅度就会很小,用户才会比较难以分辨出远处物体是否为公告板或3d模型了。
DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

下面演示了白天和黑夜的雾效
DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

最后则是alpha-to-coverage的开启/关闭效果对比
DirectX11 With Windows SDK--17 利用几何着色器实现公告板效果

directx11 with windows sdk完整目录

github项目源码