第七章后处理与实时GI入门#

一句话理解：后处理是画面的最后一步——在渲染好的图像上再做一次”滤镜”。Bloom 让亮的地方发光，Tone Mapping 把 HDR 的物理亮度映射到显示器能显示的范围，SSAO 给角落和缝隙加上暗部细节。GI（全局光照）则是让光不止照一次——它会在场景中弹射。

📋 前置知识：Ch1（渲染管线），Ch6（G-Buffer——SSAO 的输入来源于 G-Buffer 的深度和法线数据）

7.1 Bloom —— 让亮的地方发光#

为什么需要 Bloom#

1
真实世界：太阳比天空亮 10000 倍，但显示器只能显示 0-255
2
→ 没办法"真的把太阳画得更亮"
3
→ 替代方案：让亮的地方的光芒扩散到周围的暗区——视觉上产生"很亮"的错觉
4

5
这就是 Bloom：提取亮部 → 模糊 → 叠回原图

四步流程#

graph LR Step1["1. 提取亮部\n原图 × 亮度阈值\n低于阈值的 → 黑色"] Step2["2. 降采样\n逐步缩小到 1/16\n每步 + 高斯模糊"] Step3["3. 升采样\n逐步放大回原尺寸\n每步 + 高斯模糊"] Step4["4. 叠加\n模糊后的亮部图\n+ 原图 = 最终效果"] Step1 --> Step2 --> Step3 --> Step4

1
// ============ Pass 1: 提取亮部 ============
2
float4 BloomExtractPS(float2 uv : TEXCOORD) : SV_TARGET {
3
    float3 color = SAMPLE_TEXTURE2D(_MainTex, sampler_MainTex, uv).rgb;
4

5
    // 亮度 = 感知加权（人眼对绿色最敏感）
6
    float luminance = dot(color, float3(0.2126, 0.7152, 0.0722));
7

8
    // 只有超过阈值的才保留
9
    float contribution = max(0, luminance - _BloomThreshold);
10
    return float4(color * (contribution / max(luminance, 0.001)), 1.0);
11
}
12

13
// ============ Pass 2-5: 高斯模糊（降采样 + 升采样交替）============
14
// 为什么要降采样再升采样？
15
//   直接在高分辨率上做大范围模糊 → 采样核需要非常大 → 极慢
16
//   降采样到 1/16 → 同样大小的采样核覆盖了 16× 的范围 → 高效的大范围模糊
17

18
// 降采样：每次缩小 1/2 + 5×5 模糊
19
// 升采样：每次放大 1/2 + 5×5 模糊（用上一级的结果做上采样）
20

21
// 高斯模糊的水平/垂直分离：2D 高斯 = 水平 1D 高斯 + 垂直 1D 高斯
22
// 5×5 2D 高斯 = 25 次采样 → 2×(5 次采样) = 10 次采样
23
// 这就是 Bloom 用两次 1D Pass 而非一次 2D Pass 的原因
24

25
// ============ Pass 6: 叠加 ============
26
float4 BloomCompositePS(float2 uv : TEXCOORD) : SV_TARGET {
27
    float3 original = SAMPLE_TEXTURE2D(_MainTex, sampler_MainTex, uv).rgb;
28
    float3 bloom = SAMPLE_TEXTURE2D(_BloomTex, sampler_Bloom, uv).rgb;
29

30
    return float4(original + bloom * _BloomIntensity, 1.0);
31
}

Bloom 的性能考量#

1
移动端 Bloom：
2
  降采样到 1/8 或 1/16（不是 1/32——太小了没效果）
3
  使用 3×3 高斯而非 5×5
4
  或使用"快速 Bloom"——Kawase Blur（比高斯快 2-3 倍，移动端常用）
5

6
Kawase Blur：
7
  不是真正的卷积模糊——而是"取周围 4 个角 + 中心"的加权混合
8
  4 次迭代 ≈ 1 次大范围高斯的效果，但只需要 5 次采样/迭代

7.2 HDR 与 Tone Mapping#

为什么需要 HDR#

1
真实世界的亮度范围：10⁻⁶（星光）到 10⁹（太阳直射）
2
显示器能显示的亮度：0 到 255（LDR——Low Dynamic Range）
3

4
如果直接 clamp(0, 255)：
5
  亮的全白（过曝），暗的全黑（死黑），细节全丢
6

7
HDR 的做法：
8
  1. 用 16-bit 浮点格式渲染（亮度范围远超 0-255）
9
  2. 最后一步做 Tone Mapping——把 HDR 亮度"映射"到 LDR
10
  3. 类似人眼的自适应——亮的地方压缩高光，暗的地方保留细节

三种 Tone Mapping#

1
// ============ 1. Reinhard —— 最简单的 ============
2
// 原理：亮处用对数曲线压缩——越亮压缩越狠
3
float3 Reinhard(float3 hdrColor) {
4
    return hdrColor / (hdrColor + 1.0);
5
    // 输入 0.1 → 0.09（几乎不变）
6
    // 输入 1.0 → 0.5（压缩一半）
7
    // 输入 10  → 0.91（接近饱和但不过曝）
8
    // 输入 100 → 0.99（不会超过 1）
9
}
10

11
// Reinhard Extended（改进版——保留高光细节）
12
float3 ReinhardExtended(float3 hdrColor, float maxWhite) {
13
    float3 numerator = hdrColor * (1.0 + hdrColor / (maxWhite * maxWhite));
14
    return numerator / (1.0 + hdrColor);
15
}
16

17
// ============ 2. ACES —— 电影行业标准，Unity 默认 ============
18
// Academy Color Encoding System
19
// 特征：暗部偏冷调、高光自然、色彩过渡平滑
20
float3 ACES(float3 hdrColor) {
21
    float a = 2.51;
22
    float b = 0.03;
23
    float c = 2.43;
24
    float d = 0.59;
25
    float e = 0.14;
26

27
    return saturate((hdrColor * (a * hdrColor + b)) /
28
                    (hdrColor * (c * hdrColor + d) + e));
29
}
30

31
// ============ 3. Neutral —— Unity URP 默认 ============
32
// 比 ACES 简单，不做颜色偏移
33
float3 Neutral(float3 hdrColor) {
34
    float3 x = max(0, hdrColor - 0.004);
35
    float3 result = (x * (6.2 * x + 0.5)) / (x * (6.2 * x + 1.7) + 0.06);
36
    return result;
37
}

Tone Mapping 的效果对比#

1
Reinhard：
2
  → 最简单，画面偏暗偏灰（过于保守的压缩）
3
  → 小项目/HDR 预览用
4

5
ACES：
6
  → 电影感——暗部偏冷蓝，高光偏暖黄
7
  → 最具"胶片感"——3A 大作首选
8

9
Neutral：
10
  → 颜色准确——不做色调偏移
11
  → 需要颜色准确的项目（产品展示、UI 密集的游戏）

HDR → Tone Mapping → Gamma 校正的完整流程#

1
1. 渲染（HDR）
2
   场景中的亮度可以是 100、1000 甚至更高（浮点精度）
3
   Render Target 格式：R11G11B10 或 RGBA16F
4

5
2. Tone Mapping（HDR → LDR）
6
   把 HDR 亮度映射到 [0, 1] 范围
7
   同时保留高光和暗部细节
8

9
3. Gamma 校正（LDR → 显示器空间）
10
   显示器不是线性的——输入 0.5 → 显示器输出亮度 ≈ 0.22
11
   需要：color = pow(toneMappedColor, 1/2.2)
12
   让显示器上的亮度看起来像你线性空间中算的那样
13

14
   Unity 底层的 sRGB 格式 RT 自动做 Gamma 校正
15
   Linear 工作流：渲染时用线性空间 → 输出时自动 Gamma 校正

7.3 SSAO —— 屏幕空间环境光遮蔽#

直觉#

1
真实世界中：
2
  墙角、桌子底下、衣服褶皱——这些"凹陷"区域更暗
3
  不是因为光照不到，而是因为周围几何体阻挡了环境光
4

5
AO = Ambient Occlusion——环境光被几何体遮挡的程度
6

7
SSAO = Screen Space AO——在屏幕空间计算 AO
8
  只需要深度缓冲（G-Buffer 的深度）→ 不需要预烘焙 → 实时

原理#

1
// SSAO 的核心逻辑
2

3
float ComputeSSAO(float2 uv, float3 viewPos, float3 viewNormal) {
4
    float occlusion = 0.0;
5

6
    // 在法线方向的半球内随机采样 N 个点
7
    for (int i = 0; i < SAMPLE_COUNT; i++) {
8
        // 随机方向（在切线空间中——法线为 Z 轴）
9
        float3 randomDir = _SampleKernel[i];  // 预生成的采样核
10

11
        // 如果随机向量朝向法线的反方向（半球下）→ 翻转
12
        float3 sampleDir = randomDir;
13
        if (dot(sampleDir, viewNormal) < 0) {
14
            sampleDir = -sampleDir;
15
        }
16

17
        // 采样点在观察空间中的位置
18
        float3 samplePos = viewPos + sampleDir * _SampleRadius;
19

20
        // 把采样点投影回屏幕空间
21
        float4 sampleScreenPos = mul(UNITY_MATRIX_P, float4(samplePos, 1.0));
22
        sampleScreenPos.xy /= sampleScreenPos.w;
23
        float2 sampleUV = sampleScreenPos.xy * 0.5 + 0.5;
24

25
        // 采样深度——实际深度
26
        float sampleDepth = SAMPLE_TEXTURE2D(_CameraDepthTexture,
27
                                              sampler_Depth, sampleUV).r;
28
        // 重建观察空间深度（线性深度）
29
        float sampleViewDepth = LinearEyeDepth(sampleDepth);
30

31
        // 比较：采样点的实际深度 vs 这个方向的几何体深度
32
        // 采样点更远 → 有几何体挡在前面 → 贡献 AO
33
        float rangeCheck = smoothstep(0.0, 1.0,
34
            _SampleRadius / abs(viewPos.z - sampleViewDepth));
35
        occlusion += (sampleViewDepth <= samplePos.z ? 1.0 : 0.0) * rangeCheck;
36
    }
37

38
    return 1.0 - (occlusion / SAMPLE_COUNT);
39
}
40

41
// 实际的 SSAO 实现还有很多优化：
42
// - 用随机旋转纹理消除采样图案
43
// - 双边模糊——保留边缘（深度/法线不连续的地方不模糊）
44
// - 使用较低的 SSAO 分辨率（1/2 或 1/4）再做上采样

SSAO 的常见变体#

1
SSAO (Screen Space Ambient Occlusion) —— 经典版：
2
  用深度缓冲 + 法线做半球采样
3
  问题：远处会出现"灰色光晕"（场景中实际没有的暗部）
4

5
HBAO (Horizon-Based AO)：
6
  沿地平线方向搜索——更接近物理真实
7
  开销比 SSAO 大但质量更好
8

9
GTAO (Ground Truth AO)：
10
  考虑了"多次散射"——比 HBAO 更接近离线渲染质量
11
  UE5 默认使用此算法
12

13
移动端：
14
  不跑 SSAO——开销太大
15
  替代方案：烘焙 AO 到光照贴图（静态物体）+ 顶点 AO（动态物体）

7.4 Light Probe —— 动态物体的间接光照#

问题#

1
烘焙的光照贴图只对静态物体有效——它在预计算时假设物体不会移动。
2
但动态角色走到暗处时也应该变暗——怎么获得间接光照？
3

4
Light Probe = 场景中分布的光照采样球
5
  每个 Probe 编码了它所在位置"从各个方向接收到多少光"
6
  动态物体移动时，插值周围几个 Probe 的值 → 获得间接光照

球谐函数#

1
// Light Probe 用球谐（Spherical Harmonics）编码光照信息
2
// SH = 用 N 个系数描述一个球面上的函数分布
3

4
// Unity 使用 3 阶 SH = 9 个系数（R/G/B 各 9 个 = 27 个 float）
5
// 9 个系数可以近似地重建任意方向的光照强度
6

7
// SH 重建——给定法线方向，返回该方向的光照颜色
8
float3 SampleSH9(float3 N) {
9
    // Unity 已经帮你做了——在 Shader 中：
10
    // float3 ambient = ShadeSH9(half4(N, 1.0));
11

12
    // 原理（简化）：
13
    // SH0: 常数项——所有方向的平均光照（基础亮度）
14
    // SH1-SH3: 各阶球谐基函数——编码方向信息
15
    //   绿色方向比红色方向亮 → SH1 的 Y 分量非零
16
    //   天空比地面亮 → SH2 的 Z 分量偏正
17

18
    // 重建过程 = N 的各阶球谐基函数值 × 对应系数 → 累加
19
    float3 result = 0;
20

21
    // L0: 常数——平均光照
22
    result += unity_SHAr;  // 等价于取 SH 系数的第 1 项
23

24
    // L1: 线性——方向性（来自上方 vs 下方、左边 vs 右边……）
25
    result += unity_SHBr * N.x;  // 左右的差异
26
    result += unity_SHAg * N.y;  // 上下的差异
27
    result += unity_SHBb * N.z;  // 前后的差异
28

29
    // L2: 二次——更细的方向变化（天空 vs 地面、水平环绕）
30
    result += unity_SHC.r * (N.x * N.y);
31
    result += unity_SHC.g * (N.y * N.z);
32
    result += unity_SHC.b * (N.z * N.z - 1.0 / 3.0);
33

34
    return max(0, result);
35
}

球谐函数的直观理解：

1
把"球面上的光照分布"看作一个信号
2
SH = 用傅里叶级数的方法在球面上压缩这个信号
3

4
L0（1 个系数）: 整个球的平均值 → 最粗糙的近似
5
L1（3 个系数）: 哪个方向更亮 → 方向感
6
L2（5 个系数）: 天空 vs 地面 → 更细致的方向感
7
（L3+ 更高阶→保留更多细节，但系数数量平方增长）
8

9
Unity 用 L0+L1+L2 = 9 个系数：
10
  可以区分"天空方向偏蓝、地面方向偏绿"这种细节
11
  但无法表示"窗户投射的小光斑"——那需要更高阶

7.5 Reflection Probe —— 镜面反射#

1
Light Probe 只处理漫反射（各方向均匀的间接光）
2
镜面反射需要知道"从某个精确方向来了多少光"
3

4
Reflection Probe：
5
  在场景中的某个位置渲染一张 360° 环境贴图（Cubemap）
6
  附近物体的反射 = 从视线反射方向采样 Cubemap
7

8
盒投影 (Box Projection)：
9
  默认采样是"从场景中心发出的射线" → 无限远
10
  但室内场景中，反射应该在墙面上停止
11
  盒投影 = 把 Cubemap 投影到 Probe 的包围盒上
12
  → 反射被限制在房间内 → 更真实

1
// Unity 中 Reflection Probe 的采样
2
float3 SampleReflectionProbe(float3 worldPos, float3 reflectDir, float roughness) {
3
    // Unity 自动混合最近的几个 Reflection Probe
4
    // Shader 中直接调用：
5
    // half3 reflection = GlossyEnvironmentReflection(reflectDir, roughness);
6

7
    // 内部做了：
8
    // 1. 根据 worldPos 找最近的 Probe
9
    // 2. 盒投影——把反射方向限制在 Probe 的包围盒内
10
    // 3. Roughness → Mip Level — 粗糙度越高用更模糊的 Mip
11
    // 4. 多个 Probe 之间混合——避免边界突变
12
}

7.6 🎮 完整后处理管线#

1
// Unity URP 的后处理管线（Render Graph）
2
// 渲染帧 → 插入后处理 Pass
3

4
// 典型后处理管线：
5
// 1. Bloom（提取亮部 + 降采样模糊 + 升采样 + 叠加）
6
// 2. SSAO（采样深度缓冲 → 计算 AO → 模糊 → 乘到场景颜色上）
7
// 3. Tone Mapping（HDR → LDR）
8
// 4. Color Grading（LUT 调色——颜色查找表）
9
// 5. Vignette（暗角——屏幕四角渐暗）
10
// 6. Film Grain（胶片颗粒——增加质感）
11
// 7. Final Blit（输出到 Back Buffer）
12

13
// Volume 组件配置：
14
// GameObject → Volume → Add Override → 选择后处理效果
15
// 每个效果有：Intensity、Threshold、Quality 等参数
16
// Volume 的 Weight 可以平滑过渡（从一个房间走到另一个房间的后处理变化）

7.7 面试口述#

Q：“Bloom 是怎么实现的？“#

1
"Bloom 分四步。
2

3
第一步提取亮部——用亮度阈值过滤画面，只保留超过阈值的像素。
4
亮度用感知加权公式 luminance = 0.2126R + 0.7152G + 0.0722B（人眼对绿色最敏感）。
5

6
第二步降采样——逐步缩小到 1/8 或 1/16，每步做高斯模糊。
7
目的：同样的采样核在低分辨率覆盖了更大的画面范围。
8

9
第三步升采样——逐步放大回原尺寸，每步再做模糊。
10
结果是模糊的大范围光晕。
11

12
第四步叠加——把光晕图加到原图上。
13
亮的地方周围有了光晕 → 视觉上产生'超出显示器亮度范围'的错觉。"

Q：“HDR 和 Tone Mapping 的关系？为什么先 HDR 渲染再映射到 LDR？“#

1
"HDR 和 Tone Mapping 是配对的。HDR 是输入，Tone Mapping 是转换。
2

3
HDR（High Dynamic Range）指用 16-bit 浮点格式渲染——
4
亮度范围远超 0-1，场景中的太阳可以是 100、1000，暗处可以是 0.001。
5
这保留了真实世界的亮度信息——不会因为超过 1 就被 clamp 成白色。
6

7
但显示器的亮度范围只有 0-255（LDR——Low Dynamic Range），
8
不能直接显示 HDR 的亮度。Tone Mapping 就是把 HDR 亮度'映射'到 LDR 范围的操作。
9

10
为什么不能直接在 LDR 里渲染？因为光照计算需要正确的亮度比例。
11
在 LDR 中，太阳（亮度 100）和室内灯光（亮度 1）都被 clamp 到 255 → 两者看起来一样亮。
12
在 HDR 中先完整计算，再通过 Tone Mapping 压缩 → 太阳依然比灯亮得多，
13
只是都被压缩到了显示器能显示的范围——细节保留，层次感保留。
14

15
完整管线是：
16
HDR 渲染（浮点 RT）→ Tone Mapping（映射到 [0,1]）→ Gamma 校正（适配显示器）→ 输出。
17

18
常见的 Tone Mapping：ACES（电影感——暗部偏冷高光偏暖）、
19
Reinhard（简单——y=x/(x+1)，画面偏灰）、Neutral（颜色准确——不做色调偏移）。"

Q：“Light Probe 和 Reflection Probe 的区别？“#

1
"Light Probe 处理漫反射间接光照——用球谐函数（SH）编码空间中的光照分布。
2
采样时根据法线方向获得该点的环境色。适合动态物体的环境光。
3

4
Reflection Probe 处理镜面反射——用 Cubemap 存 360° 环境贴图。
5
采样时根据反射方向读取贴图，支持盒投影把反射限制在局部空间。
6
不同粗糙度对应不同 Mip 级别的模糊效果。
7

8
简单说：Light Probe 回答'这个点有多亮'，
9
Reflection Probe 回答'这个方向看过去有什么'。"

7.8 本章回顾#

概念	一句话
Bloom	提取亮部 → 降采样模糊 → 升采样 → 叠加——亮的地方发光
HDR	用浮点格式渲染——保留超亮和超暗的细节
Tone Mapping	HDR → LDR 的映射——ACES（电影感）/Reinhard（简单）/Neutral（准确）
Gamma 校正	pow(color, 1/2.2)——让线性颜色在显示器上正确显示
SSAO	屏幕空间计算环境光遮挡——深度缓冲 + 法线半球采样
Light Probe	球谐函数编码空间光照——动态物体的漫反射间接光
Reflection Probe	Cubemap + 盒投影——镜面反射的环境来源

📖 最终章：第八章移动端渲染架构与调试 —— Tile-Based GPU、移动端性能特征、RenderDoc 抓帧实战。前面七章的理论，在移动端都有截然不同的实践。

音乐

音乐

第七章后处理与实时GI入门#

7.1 Bloom —— 让亮的地方发光#

为什么需要 Bloom#

四步流程#

Bloom 的性能考量#

7.2 HDR 与 Tone Mapping#

为什么需要 HDR#

三种 Tone Mapping#

Tone Mapping 的效果对比#

HDR → Tone Mapping → Gamma 校正的完整流程#

7.3 SSAO —— 屏幕空间环境光遮蔽#

直觉#

原理#

SSAO 的常见变体#

7.4 Light Probe —— 动态物体的间接光照#

问题#

球谐函数#

7.5 Reflection Probe —— 镜面反射#

7.6 🎮 完整后处理管线#

7.7 面试口述#

Q：“Bloom 是怎么实现的？“#

Q：“HDR 和 Tone Mapping 的关系？为什么先 HDR 渲染再映射到 LDR？“#

Q：“Light Probe 和 Reflection Probe 的区别？“#

7.8 本章回顾#

文章分享

评论区

音乐

目录

音乐

音乐

第七章 后处理与实时GI入门

第七章 后处理与实时GI入门#

7.1 Bloom —— 让亮的地方发光#

为什么需要 Bloom#

四步流程#

Bloom 的性能考量#

7.2 HDR 与 Tone Mapping#

为什么需要 HDR#

三种 Tone Mapping#

Tone Mapping 的效果对比#

HDR → Tone Mapping → Gamma 校正的完整流程#

7.3 SSAO —— 屏幕空间环境光遮蔽#

直觉#

原理#

SSAO 的常见变体#

7.4 Light Probe —— 动态物体的间接光照#

问题#

球谐函数#

7.5 Reflection Probe —— 镜面反射#

7.6 🎮 完整后处理管线#

7.7 面试口述#

Q：“Bloom 是怎么实现的？“#

Q：“HDR 和 Tone Mapping 的关系？为什么先 HDR 渲染再映射到 LDR？“#

Q：“Light Probe 和 Reflection Probe 的区别？“#

7.8 本章回顾#

文章分享

评论区

音乐

目录

第七章后处理与实时GI入门

第七章后处理与实时GI入门#