第五章性能优化总论：从 Profiler 到上线#

一句话理解：优化的第一原则——先 Profile，再优化。你直觉认为”这里慢”的地方，90% 不是真正的瓶颈。Profiler 不会骗你，直觉会。

📋 前置知识：本系列全部章节——优化章是前四章知识的综合运用

5.1 优化的三条铁律#

铁律一：没 Profile 不优化#

1
人脑的直觉在性能问题上是系统性的错误：
2

3
你以为慢的：复杂的 AI 决策、物理计算
4
实际上慢的：UI Canvas 重建、GC Alloc、意外的 FindObjectOfType
5

6
每一帧只有 16.67ms（60 FPS）的预算。
7
Profiler 告诉你这 16.67ms 花在哪了——其它都是猜测。

铁律二：优化瓶颈，不优化”看起来能优化”的#

1
一个函数耗时 0.1ms，你花了三天优化到 0.05ms → 省了 0.05ms
2
一个 DrawCall 合批问题耗时 4ms，修一下 → 省了 4ms
3

4
投入产出比：4ms / 0.05ms = 80 倍

铁律三：在目标设备上 Profile#

1
Editor 中的 Profiler 不等于真机：
2
- Editor 有额外的调试开销
3
- PC 的 CPU/GPU 性能可能比手机高 10-50 倍
4
- PC 上不卡的场景手机上可能只有 15 FPS
5

6
必须在目标设备上运行 Profiler（Build 版本，Development Build 勾选）

5.2 CPU 优化#

Unity Profiler 的使用#

1
Profiler 窗口的核心模块：
2

3
CPU Usage    → 每帧各个函数的耗时（按时间排序）
4
GPU Usage    → 渲染耗时（DrawCall、Shader 等）
5
Memory       → 内存分配、泄漏、GC
6
Rendering    → DrawCall 数量、合批统计、SetPass Call
7
Audio        → 音频开销
8
Physics      → 物理模拟耗时

最常见的 CPU 瓶颈及修复#

瓶颈一：GC Alloc——分配了临时内存

1
// ❌ GC Alloc 的常见制造者
2
void Update() {
3
    // 1. 字符串拼接——每次拼接分配新 string
4
    string display = "HP: " + currentHealth + "/" + maxHealth;
5
    // 每帧分配 1 个 string ≈ 40 bytes → 60 FPS = 2.4KB/s
6

7
    // 2. LINQ——背后有迭代器分配
8
    var aliveEnemies = enemies.Where(e => e.IsAlive).ToList();
9
    // Where 分配迭代器 + ToList 分配 List
10

11
    // 3. foreach 在非泛型容器上
12
    foreach (var item in oldArrayList) {}  // 装箱分配
13

14
    // 4. 闭包——每次 lambda 可能分配
15
    button.onClick.AddListener(() => DoSomething(param));
16
    // 捕获 param → 分配闭包对象
17
}

1
// ✅ 修复方案
2
void Update() {
3
    // 1. 用 StringBuilder 或 TMP.SetText 的重载
4
    tmpText.SetText("HP: {0}/{1}", currentHealth, maxHealth);
5

6
    // 2. 不用 LINQ——手写循环
7
    int aliveCount = 0;
8
    for (int i = 0; i < enemies.Count; i++) {
9
        if (enemies[i].IsAlive) aliveCount++;
10
    }
11

12
    // 3. 用泛型容器
13
    foreach (var item in genericList) {}  // 无分配
14

15
    // 4. 缓存委托
16
    button.onClick.AddListener(cachedDoSomething);
17
    // 如果必须传参，用成员变量而非闭包捕获
18
}
19

20
private System.Action cachedDoSomething;
21

22
void Awake() {
23
    cachedDoSomething = DoSomething;
24
}

瓶颈二：Update 中的重操作

1
// Profiler 中 Update 耗时 > 2ms 的常见原因：
2

3
// ❌ 1. GetComponent<T>() 在 Update 中
4
void Update() {
5
    var rb = GetComponent<Rigidbody>();
6
    var anim = GetComponent<Animator>();
7
    // GetComponent 约 0.0001ms——但积少成多
8
}
9

10
// ❌ 2. GameObject.Find / FindObjectOfType
11
void Update() {
12
    var manager = FindObjectOfType<GameManager>();  // 遍历整个场景！
13
}
14

15
// ❌ 3. Camera.main
16
void Update() {
17
    var cam = Camera.main;  // 内部是 FindGameObjectWithTag("MainCamera")
18
}
19

20
// ❌ 4. 未缓存的 Transform 访问
21
void Update() {
22
    transform.position += Vector3.forward;
23
    // transform 是 C# 属性——每次访问跨 C++/C# 边界
24
    // 连续访问 10 次 = 10 次跨边界调用
25
}

1
// ✅ 缓存一切
2
public class PlayerOptimized : MonoBehaviour {
3
    private Rigidbody rb;
4
    private Animator animator;
5
    private Camera mainCam;
6
    private Transform cachedTransform;
7

8
    void Awake() {
9
        rb = GetComponent<Rigidbody>();
10
        animator = GetComponent<Animator>();
11
        mainCam = Camera.main;
12
        cachedTransform = transform;
13
    }
14

15
    void Update() {
16
        // 使用缓存引用——零查找开销
17
        cachedTransform.position += Vector3.forward * Time.deltaTime;
18
    }
19
}

瓶颈三：过度频繁的 Update

1
// ❌ 不需要每帧运行的逻辑也放 Update 里
2
void Update() {
3
    CheckQuestCompletion();  // 任务完成状态——每秒检查一次足够
4
    UpdateMinimap();          // 小地图——每秒 2 次足够
5
    RefreshFriendList();      // 好友列表——10 秒一次足够
6
}
7

8
// ✅ 用定时器降频——协程或计时器
9
[SerializeField] private float questCheckInterval = 1f;
10
private float questCheckTimer;
11

12
void Update() {
13
    questCheckTimer += Time.deltaTime;
14
    if (questCheckTimer >= questCheckInterval) {
15
        CheckQuestCompletion();
16
        questCheckTimer = 0f;
17
    }
18
}
19

20
// 或者用协程
21
IEnumerator SlowUpdate() {
22
    var wait = new WaitForSeconds(1f);
23
    while (true) {
24
        CheckQuestCompletion();
25
        yield return wait;
26
    }
27
}

5.3 GPU 优化#

DrawCall 优化的四板斧#

这是游戏性能优化中最重要的话题。四种合批方式，各有适用场景：

1
// ============ 1. Static Batching（静态合批）============
2
// 适用：标记为 Static 的、永远不会动的物体
3
// 原理：构建时把多个静态物体的 Mesh 合并为一个超大的 Mesh
4
//       运行时一次 DrawCall 渲染全部
5
// 条件：物体标记为 Batching Static
6
//
7
// 优点：运行时零开销（合并在构建时完成）
8
// 缺点：合并后的 Mesh 占用额外内存（每个物体一份位置数据）
9
//       运行时不能移动物体
10

11
// ============ 2. Dynamic Batching（动态合批）============
12
// 适用：小 Mesh（顶点数 < 300）、同材质的小物体
13
// 原理：运行时每帧尝试合批——CPU 端合并顶点
14
// 条件：同材质 + 顶点属性一致 + 顶点数 < 900（Unity 的限制）
15
//
16
// 优点：不需要标记 Static，物体可以移动
17
// 缺点：每帧 CPU 端合并顶点 → CPU 开销
18
//       顶点限制严苛（大多数 3D 模型不符合条件）
19

20
// ============ 3. GPU Instancing（GPU 实例化）============
21
// 适用：大量相同 Mesh 的物体（树、石头、子弹）
22
// 原理：把"渲染 N 个相同 Mesh"的指令一次发给 GPU
23
//       每个实例可以有不同位置/颜色/缩放（通过 Instance Buffer）
24
// 条件：同 Mesh + 同 Material（Shader 需支持 Instancing）
25
//
26
// 优点：CPU 开销极低（一次 DrawCall 渲染 N 个实例）
27
//       物体可以有不同的 Transform
28
// 缺点：每个实例不能有不同的 Material Property Block（有限支持）
29

30
// ============ 4. SRP Batcher（可编程渲染管线合批）============
31
// 适用：URP/HDRP 项目，同 Shader 但不同材质的物体
32
// 原理：不是合并 Mesh，而是**复用 Shader 的常量缓冲区**
33
//       同 Shader → 材质参数存在 GPU 缓存 → 切换材质零开销
34
// 条件：URP 或 HDRP + Shader 兼容 SRP Batcher
35
//
36
// 优点：比传统 DrawCall 合批灵活得多
37
//       不同材质但同 Shader 也可以高效渲染
38
// 缺点：仅 URP/HDRP——Built-in RP 不支持
39

40
// ============ 选型指南 ============
41
//
42
// Built-in RP（旧项目）：
43
//   静态物体    → Static Batching
44
//   小动态物体  → Dynamic Batching
45
//   大量同类物体 → GPU Instancing
46
//
47
// URP / HDRP（新项目）：
48
//   优先 SRP Batcher（适用性最好）
49
//   大量同 Mesh 物体 → GPU Instancing（与 SRP Batcher 互补）

实战：从 93 个 DrawCall 到 4 个#

1
// 场景：一个战斗场景，包含——
2
// 20 棵树（同 Mesh，不同位置/缩放）
3
// 15 块石头（静态）
4
// 地编（多个静态 Mesh 拼接）
5
// 3 个角色 + 武器特效（动态）
6
// UI（独立 Canvas）
7

8
// ============ 优化前（93 DrawCall）============
9
// 树：20（每棵一个 DrawCall——没开 Instancing）
10
// 石头：15（没标记 Static——没合批）
11
// 地编：25（多个 Mesh 拼接——没标记 Static）
12
// 角色 + 武器：3
13
// UI：15（全在一个 Canvas）
14
// 天空盒 + 后处理 + 阴影：15
15

16
// ============ 优化后（4 DrawCall + 15 UI DrawCall）============
17
//
18
// 步骤 1：开启 GPU Instancing
19
//   → 树的 Material 勾选 Enable GPU Instancing
20
//   → 20 棵树 → 1 个 DrawCall
21
//
22
// 步骤 2：标记 Static Batching
23
//   → 石头 + 地编标记 Static
24
//   → 15 + 25 = 40 个物体 → 1 个合并后的 DrawCall
25
//
26
// 步骤 3：UI Canvas 拆分
27
//   → 静态 UI（背景/边框）→ Canvas_Static
28
//   → 动态 UI（血条/计时器）→ Canvas_Dynamic
29
//   → 合批条件改善 + 独立 Canvas 减少重建范围
30
//
31
// 步骤 4：SRP Batcher（如果切到 URP）
32
//   → 剩下的动态物体（角色/武器）——同 Shader 自动合批
33

34
// 最终：4 个主场景 DrawCall + 合理的 UI DrawCall

Overdraw 优化#

1
Overdraw = 同一个像素被多次绘制
2
屏幕上一个像素先画了天空 → 再画地形 → 再画草 → 再画特效 → 最终颜色
3

4
正常的 Overdraw 是不可避免的（景深关系）
5
但过度的 Overdraw 是性能杀手：
6
  - 多层 UI 叠加（Panel 套 Panel 套 Panel 套 Button）
7
  - 大量半透明粒子叠加
8
  - 实心 UI 元素设置了不必要的透明度
9

10
移动端的填充率（Fill Rate）是主要瓶颈——
11
屏幕分辨率越来越高，Overdraw 的代价越来越大

1
// Unity 中检查 Overdraw
2
// Scene 视图 → Shading Mode → Overdraw
3
// 越亮 = Overdraw 越严重 = 越需要优化
4

5
// 常见修复：
6
// 1. UI：把不透明的 Image 的 alpha = 0 改 alpha = 1（避免走透明渲染管线）
7
// 2. 粒子：减少粒子数量 + 缩小粒子大小
8
// 3. 地形：合理的遮挡剔除减少被挡住的 draw

5.4 内存优化#

内存的三种分配方式#

1
Stack（栈）：
2
  分配：函数调用时自动分配，返回时自动释放
3
  大小：通常 1-2 MB
4
  特点：极快，无 GC，无碎片
5
  内容：值类型（int、float、struct）、局部变量引用
6

7
Heap - Managed（托管堆）：
8
  分配：用 new 关键字，由 GC 自动回收
9
  特点：方便但有 GC 开销
10
  内容：所有 class 实例、string、数组、List<T>
11

12
Heap - Native（原生堆）：
13
  分配：通过 Allocator 手动分配，必须手动释放
14
  特点：无 GC，适合大量数据（纹理、Mesh、音频）
15
  内容：Texture2D、Mesh、AudioClip 的底层数据

GC 是怎么工作的#

1
GC 的简化流程：
2

3
1. 托管堆上分配内存
4
2. 堆用完了 → GC 启动
5
3. GC 标记所有"活着的对象"（从 Root Reference 出发遍历）
6
4. GC 清理"死掉的对象"
7
5. GC 压缩内存（移动存活对象，消除碎片）
8
   → 这一步可能暂停程序几十到上百毫秒！
9
   → 这就是游戏突然卡一下的常见原因
10

11
关键数字：
12
- 零 GC Alloc = 零 GC 触发 = 零卡顿
13
- 每帧 GC Alloc < 1KB 可以接受
14
- GC Alloc > 10KB/帧 → 一定会有 GC 导致的卡顿

消除 GC Alloc#

1
// ============ 字符串操作 ============
2
// ❌ 每帧分配新 string
3
void Update() {
4
    string msg = "Score: " + score + " / " + maxScore;  // 分配
5
    scoreText.text = msg;
6
}
7

8
// ✅ 只在值变化时更新 + SetText 避免拼接
9
private int lastScore = -1;
10
void Update() {
11
    if (score != lastScore) {
12
        scoreText.SetText("Score: {0} / {1}", score, maxScore);
13
        lastScore = score;
14
    }
15
}
16

17
// ============ LINQ ============
18
// ❌ LINQ 内部有迭代器分配
19
var alive = enemies.Where(e => e.health > 0).OrderBy(e => e.distance).ToList();
20
// 分配：Where 迭代器 + OrderBy 内部结构 + ToList
21

22
// ✅ 手写循环——零分配
23
List<Enemy> aliveList = GetCachedList();  // 复用 List
24
aliveList.Clear();
25
for (int i = 0; i < enemies.Count; i++) {
26
    if (enemies[i].health > 0) {
27
        aliveList.Add(enemies[i]);
28
    }
29
}
30
aliveList.Sort((a, b) => a.distance.CompareTo(b.distance));
31

32
// ============ 装箱 ============
33
// ❌ struct 转 object → 装箱（托管堆分配）
34
int count = 42;
35
object boxed = count;  // 装箱！~24 bytes 分配
36

37
// ❌ 常见装箱场景
38
Debug.Log("Count: " + count);  // + 操作符对 int 用 object → 装箱
39
string.Format("{0}", count);   // object 参数 → 装箱
40

41
// ✅ 避免装箱
42
Debug.Log($"Count: {count}");  // 字符串插值——无装箱
43

44
// ============ 容器扩容 ============
45
// ❌ new List<T>() 默认 capacity = 0
46
// 第一次 Add 扩容到 4 → 第 5 个扩容到 8 → 第 9 个扩容到 16 → ...
47
// 每次扩容 = new T[newSize] + 复制旧数组 → GC Alloc
48

49
// ✅ 预分配容量
50
List<Bullet> bullets = new List<Bullet>(500);  // 提前知道最大值

资源内存管理#

1
// ============ 纹理压缩 ============
2
// PC：DXT1/DXT5（BC1/BC3）
3
// Android：ASTC 或 ETC2
4
// iOS：ASTC 或 PVRTC
5
//
6
// 未压缩 2048×2048 RGBA = 2048 × 2048 × 4 = 16MB
7
// ASTC 4×4 压缩后 ≈ 2048 × 2048 × 1 = 4MB
8
// 节省 75%
9

10
// Unity 设置：Texture Import Settings → Format → 选择合适的压缩格式
11

12
// ============ 音频压缩 ============
13
// PCM（未压缩）：44100 × 16bit × 2ch = 176KB/s
14
// Vorbis（压缩）：质量 70% ≈ 50KB/s
15
// 节省 70%
16

17
// ============ Resources 文件夹的问题 ============
18
// ❌ Resources 下的所有资源——不管用不用——都打进包
19
// 还都在游戏启动时索引（增加启动时间）
20
//
21
// ✅ 用 Addressables 或 AssetBundle 替代 Resources
22
// 按需加载、按需释放
23

24
// ============ 场景卸载后内存不释放 ============
25
// ❌ LoadScene 切换场景，旧场景的资源还在内存里
26
// ✅ 调用 Resources.UnloadUnusedAssets()——但注意这会触发 GC
27

28
IEnumerator UnloadPreviousScene() {
29
    AsyncOperation op = SceneManager.UnloadSceneAsync(previousScene);
30
    yield return op;
31

32
    // 清理未使用的资源
33
    AsyncOperation unloadOp = Resources.UnloadUnusedAssets();
34
    yield return unloadOp;
35
    // 注意：UnloadUnusedAssets 本身有开销，不要每帧调用
36
}

5.5 🎮 完整实战：从卡顿到流畅#

初始场景#

1
一个战斗 Demo：
2
  - 30 个敌人 + 1 个玩家
3
  - 粒子特效（攻击火花、受击血迹）
4
  - UI 血条（每个敌人头顶一个 + 玩家 HUD）
5
  - 地形 + 装饰物
6

7
Profiler 数据（优化前）：
8
  - FPS: 25-35（Target: 60）
9
  - CPU: 22ms（预算 16.67ms）
10
    - Scripts: 14ms（Update 占了 11ms）
11
    - Rendering: 6ms（93 DrawCall）
12
  - GC Alloc: 45KB/帧
13
  - 内存: 780MB

第一轮优化：CPU#

1
步骤 1：打开 Profiler，展开 CPU Usage → Scripts
2

3
发现：
4
  EnemyUpdate: 6.2ms（30 个敌人 × ~0.2ms）
5
  HealthBarUpdate: 3.1ms（30 个血条，每帧 GetComponent<Slider>() + 字符串拼接）
6
  UIManager.Update: 1.2ms（每帧 FindObjectOfType）
7

8
修复：
9
  1. Enemy.cs——缓存 Transform、Animator、Rigidbody 引用
10
     EnemyUpdate: 6.2ms → 3.5ms
11

12
  2. HealthBar.cs——Awake 缓存 Slider 引用，用 SetText 替代字符串拼接
13
     HealthBarUpdate: 3.1ms → 0.8ms
14

15
  3. UIManager.cs——Awake 时缓存引用，不再每帧 Find
16
     UIManager.Update: 1.2ms → 0.1ms
17

18
第一轮后：CPU 22ms → 14ms，FPS 35 → 55

第二轮优化：GC Alloc#

1
步骤 2：打开 Profiler → Memory → GC Alloc
2

3
发现：
4
  每帧分配 45KB：
5
    - 字符串拼接: 15KB
6
    - LINQ: 12KB
7
    - foreach 装箱: 8KB
8
    - 其它: 10KB
9

10
修复：
11
  1. 所有 Update 中的字符串拼接 → SetText / StringBuilder
12
  2. 替换 LINQ 为手写循环
13
  3. 用泛型 List<T> 替代 ArrayList
14

15
第二轮后：GC Alloc 45KB → 2KB/帧，消除了 GC 卡顿

第三轮优化：GPU#

1
步骤 3：打开 Frame Debugger，逐 DrawCall 分析
2

3
发现：
4
  93 DrawCall：
5
    - 30 个敌人（30 DrawCall）——每个敌人的 Mesh 不同，没法 Instancing
6
    - 15 棵树（15 DrawCall）——没开 Instancing
7
    - 20 块石头（20 DrawCall）——没标 Static
8
    - 15 个头顶血条（15 DrawCall）——没合批
9
    - 13 个其它（天空盒、阴影、后处理）
10

11
修复：
12
  1. 树 → Material 勾选 Enable GPU Instancing
13
     15 DrawCall → 1 DrawCall
14

15
  2. 石头 → 标记 Static Batching
16
     20 DrawCall → 1 DrawCall（合并后）
17

18
  3. 头顶血条 → 独立 Canvas + 图集 + Canvas 拆分
19
     15 DrawCall → 3 DrawCall
20

21
  4. 敌人 → 不需要每帧 Instantiate 特效 → 用粒子对象池
22

23
第三轮后：93 DrawCall → 36 DrawCall

优化前后对比#

1
                优化前      第一轮后    第二轮后    第三轮后
2
FPS             25-35       50-55       55-58       60 稳定
3
CPU (Scripts)   14ms        9ms         8ms         7ms
4
CPU (Rendering) 6ms         6ms         5ms         3ms
5
GC Alloc/frame  45KB        18KB        2KB         1.5KB
6
DrawCall        93          93          85          36
7
内存            780MB       780MB       780MB       740MB
8

9
总收益：FPS 翻倍，CPU 降低 41%，DrawCall 减少 61%，GC Alloc 减少 97%
10
核心修复不超过 15 行代码。

5.6 优化清单——上线前必查#

1
CPU 优化：
2
□ Profiler CPU Usage 无 > 1ms 的单帧尖刺
3
□ 所有 Update 中的 GetComponent / FindObjectOfType 已缓存
4
□ 无逐帧 GetComponent<T>()
5
□ Camera.main 已缓存（内部是 FindGameObjectWithTag）
6
□ 高频逻辑已降频（用计时器替代每帧执行）
7
□ 输入检测在 Update，物理操作在 FixedUpdate
8

9
内存优化：
10
□ GC Alloc 每帧 < 2KB
11
□ 无 Update 中的字符串拼接（用 SetText/StringBuilder）
12
□ 无 Update 中的 LINQ
13
□ 容器已预分配容量（new List<T>(capacity)）
14
□ Resources 文件夹无冗余资源（或已迁移到 Addressables）
15
□ 纹理已压缩（移动端 ASTC/ETC2，PC DXT/BC）
16
□ 音频已压缩（Vorbis/MP3）
17

18
GPU 优化：
19
□ 静态物体已标记 Static Batching
20
□ 大量同 Mesh 物体已开启 GPU Instancing
21
□ URP/HDRP 项目已启用 SRP Batcher
22
□ UI Canvas 已按更新频率拆分（静态/动态/ScrollRect 分开）
23
□ UI 使用了 Sprite Atlas
24
□ LOD Group 已配置
25
□ Occlusion Culling 已烘焙
26
□ DrawCall < 200（移动端 < 100）
27

28
通用：
29
□ 在所有目标设备上 Profiler 过（不只是 Editor）
30
□ 无 Destroy 后未置空的引用
31
□ 场景切换后无内存泄漏（Memory Profiler 确认）
32
□ 长时间运行无持续内存增长（挂机 30 分钟测试）

5.7 引擎系列终章回顾#

五章，从引擎的心跳到优化清单：

1
Ch1 游戏循环   → 引擎的心跳——理解每一帧发生了什么
2
Ch2 场景管理   → 世界的组织——空间划分决定了查询效率
3
Ch3 UI 系统    → 界面的性能——Canvas 重建和 DrawCall 合批是最容易忽视的瓶颈
4
Ch4 游戏 AI    → 决策与导航——FSM→行为树→GOAP + A*→NavMesh
5
Ch5 性能优化   → 系统方法论——Profile → 定位瓶颈 → 修复 → 验证

这个系列和设计模式系列的关系：

1
设计模式系列：教你"怎么写"——代码架构和组织方式
2
引擎基础系列：教你"怎么跑"——引擎的运作原理和性能取舍
3

4
两者叠加：
5
  引擎基础告诉你"Canvas 脏了就重建"（原理）
6
  设计模式告诉你"用 MVVM + 观察者让数据驱动 UI 更新"（方案）
7

8
  引擎基础告诉你"FixedUpdate 固定步长"（原理）
9
  设计模式告诉你"命令模式 + 帧同步做确定性回放"（方案）

全系列与 JD 的最终映射：

1
JD 任职要求                          覆盖系列
2
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
3
数据结构/算法                        数据结构 + 算法专题 ✅
4
操作系统                              OS 笔记 ✅
5
计算机网络                            网络笔记 ✅
6
语言原理与底层细节                     C++ 深入 ✅
7
系统性编程思维 + 可扩展代码实现         设计模式 ✅
8
AI / 3C / 战斗逻辑 / UI / 场景管理     引擎基础 ✅
9
网络同步 / 内存优化 / 渲染效率          网络 + 引擎基础 ✅

📖 全系列完结。每一章的目标都是一样的：让你在面试中不仅答得出”是什么”，还能答出”为什么这样设计”和”我踩过这个坑”。

📖 本系列全部文章均采用 CC BY-NC-SA 4.0 协议发布。

音乐

音乐

第五章性能优化总论：从 Profiler 到上线#

5.1 优化的三条铁律#

铁律一：没 Profile 不优化#

铁律二：优化瓶颈，不优化”看起来能优化”的#

铁律三：在目标设备上 Profile#

5.2 CPU 优化#

Unity Profiler 的使用#

最常见的 CPU 瓶颈及修复#

5.3 GPU 优化#

DrawCall 优化的四板斧#

实战：从 93 个 DrawCall 到 4 个#

Overdraw 优化#

5.4 内存优化#

内存的三种分配方式#

GC 是怎么工作的#

消除 GC Alloc#

资源内存管理#

5.5 🎮 完整实战：从卡顿到流畅#

初始场景#

第一轮优化：CPU#

第二轮优化：GC Alloc#

第三轮优化：GPU#

优化前后对比#

5.6 优化清单——上线前必查#

5.7 引擎系列终章回顾#

文章分享

评论区

音乐

目录

音乐

音乐

第五章 性能优化总论：从 Profiler 到上线

第五章 性能优化总论：从 Profiler 到上线#

5.1 优化的三条铁律#

铁律一：没 Profile 不优化#

铁律二：优化瓶颈，不优化”看起来能优化”的#

铁律三：在目标设备上 Profile#

5.2 CPU 优化#

Unity Profiler 的使用#

最常见的 CPU 瓶颈及修复#

5.3 GPU 优化#

DrawCall 优化的四板斧#

实战：从 93 个 DrawCall 到 4 个#

Overdraw 优化#

5.4 内存优化#

内存的三种分配方式#

GC 是怎么工作的#

消除 GC Alloc#

资源内存管理#

5.5 🎮 完整实战：从卡顿到流畅#

初始场景#

第一轮优化：CPU#

第二轮优化：GC Alloc#

第三轮优化：GPU#

优化前后对比#

5.6 优化清单——上线前必查#

5.7 引擎系列终章回顾#

文章分享

评论区

音乐

目录

第五章性能优化总论：从 Profiler 到上线

第五章性能优化总论：从 Profiler 到上线#