6.4 堆与优先队列#

一句话理解：堆是一棵用数组存储的完全二叉树，满足”父节点 ≥ 子节点”(最大堆) 或”父节点 ≤ 子节点”(最小堆)。它能在 O(1) 取最值、O(log n) 插入/删除，是优先队列、堆排序、Top-K 问题的底层基石。

6.4.1 概念与性质#

完全二叉树 + 堆序性#

堆 = 两条性质的组合：

1
1. 结构性质（完全二叉树）：
2
   除最后一层外全满，最后一层从左到右连续填充
3
   → 可以用数组紧凑存储，无空洞
4

5
2. 堆序性质（Heap Property）：
6
   最大堆：parent.val ≥ children.val
7
   最小堆：parent.val ≤ children.val
8
   → 根节点是全局最大/最小值

graph TD subgraph "最大堆" A1["90"] --> B1["80"] A1 --> C1["70"] B1 --> D1["50"] B1 --> E1["60"] C1 --> F1["30"] C1 --> G1["40"] end subgraph "最小堆" A2["10"] --> B2["20"] A2 --> C2["30"] B2 --> D2["50"] B2 --> E2["40"] C2 --> F2["60"] C2 --> G2["70"] end style A1 fill:#d00000,stroke:#e85d04,color:white style A2 fill:#2d6a4f,stroke:#40916c,color:white

数组存储 —— 堆的精髓#

完全二叉树可以完美映射到数组，不浪费任何空间：

1
最大堆：        90
2
               /  \
3
             80    70
4
            / \   / \
5
           50 60 30 40
6

7
数组 (0-indexed): [90, 80, 70, 50, 60, 30, 40]
8
下标:               0   1   2   3   4   5   6

父子关系公式（0-indexed）：

关系	公式
父节点	`(i - 1) / 2`
左子节点	`2 * i + 1`
右子节点	`2 * i + 2`
最后一个非叶节点	`(n / 2) - 1`

💡 为什么用数组？ 完全二叉树是唯一可以用数组零浪费存储的树结构。数组存储带来两个巨大优势：(1) cache 友好——连续内存，遍历时 cache 命中率极高；(2) 零指针开销——不需要 left/right 指针，节省 2 × 8 = 16 字节/节点。

堆 ≠ BST#

面试中常见的混淆：

对比	堆	BST
约束	父 ≥ 子（或 ≤）	左 < 根 < 右
能做什么	O(1) 取最值	O(log n) 查找任意值
不能做什么	不支持精确查找	不能 O(1) 取最值
存储	数组	链式（指针）
有序遍历	❌	✅ 中序遍历有序

6.4.2 核心操作#

sift-up（上浮）—— 插入时用#

1
插入 85 到最大堆 [90, 80, 70, 50, 60, 30, 40]：
2

3
Step 1: 追加到末尾
4
  [90, 80, 70, 50, 60, 30, 40, 85]
5
                                 ↑ 新元素 (index=7)
6

7
Step 2: 上浮——与父节点比较，如果更大就交换
8
  85 vs parent=50 (index=3)  →  85 > 50 → swap!
9
  [90, 80, 70, 85, 60, 30, 40, 50]
10

11
  85 vs parent=80 (index=1)  →  85 > 80 → swap!
12
  [90, 85, 70, 80, 60, 30, 40, 50]
13

14
  85 vs parent=90 (index=0)  →  85 < 90 → 停！
15

16
最终: [90, 85, 70, 80, 60, 30, 40, 50]

sift-down（下沉）—— 删除最大值时用#

1
删除最大值（堆顶 90）：
2

3
Step 1: 用末尾元素替换堆顶
4
  [50, 85, 70, 80, 60, 30, 40]
5
   ↑ 50 不应该在这里
6

7
Step 2: 下沉——与较大的子节点比较，如果更小就交换
8
  50 vs max(left=85, right=70) = 85  →  50 < 85 → swap!
9
  [85, 50, 70, 80, 60, 30, 40]
10

11
  50 vs max(left=80, right=60) = 80  →  50 < 80 → swap!
12
  [85, 80, 70, 50, 60, 30, 40]
13

14
  50 没有子节点了 → 停！
15

16
最终: [85, 80, 70, 50, 60, 30, 40]

💡 sift-down 的关键：必须和较大的子节点交换（最大堆）。如果和较小的交换，交换后的父节点可能比另一个子节点小，仍然违反堆序。

buildHeap —— O(n) 建堆#

从无序数组建堆有两种方法：

1
方法 1：逐个插入 → n 次 sift-up → O(n log n)
2
方法 2：自底向上 sift-down → O(n) ✅
3

4
方法 2 的过程：
5
  从最后一个非叶节点开始，逐个向前做 sift-down
6

7
  为什么是 O(n)？
8
  - 叶节点（n/2 个）不需要下沉 → 0 次操作
9
  - 倒数第二层（n/4 个）最多下沉 1 次
10
  - 倒数第三层（n/8 个）最多下沉 2 次
11
  - ...
12
  - 根节点（1 个）最多下沉 log n 次
13

14
  总操作 = n/4·1 + n/8·2 + n/16·3 + ... = O(n)（收敛的等比级数）

6.4.3 C++ 实现#

手写最大堆#

1
template <typename T, typename Compare = std::less<T>>
2
class BinaryHeap {
3
    std::vector<T> _data;
4
    Compare _cmp;  // 默认 less → 最大堆（父 > 子）
5

6
    // ===== 辅助 =====
7
    int _parent(int i) const { return (i - 1) / 2; }
8
    int _left(int i) const   { return 2 * i + 1; }
9
    int _right(int i) const  { return 2 * i + 2; }
10

11
    // ===== 上浮 =====
12
    void _sift_up(int i) {
13
        while (i > 0 && _cmp(_data[_parent(i)], _data[i])) {
14
            // 父 < 子（违反堆序）→ 交换
15
            std::swap(_data[_parent(i)], _data[i]);
16
            i = _parent(i);
17
        }
18
    }
19

20
    // ===== 下沉 =====
21
    void _sift_down(int i) {
22
        int n = _data.size();
23
        while (true) {
24
            int largest = i;
25
            int l = _left(i);
26
            int r = _right(i);
27

28
            if (l < n && _cmp(_data[largest], _data[l]))
29
                largest = l;
30
            if (r < n && _cmp(_data[largest], _data[r]))
31
                largest = r;
32

33
            if (largest == i) break;  // 已满足堆序
34

35
            std::swap(_data[i], _data[largest]);
36
            i = largest;
37
        }
38
    }
39

40
public:
41
    BinaryHeap() = default;
42

43
    // 从数组建堆 → O(n)
44
    BinaryHeap(std::vector<T> data) : _data(std::move(data)) {
45
        // 自底向上 sift-down
46
        for (int i = static_cast<int>(_data.size()) / 2 - 1; i >= 0; --i) {
47
            _sift_down(i);
48
        }
49
    }
50

51
    // 插入 → O(log n)
52
    void push(const T& val) {
53
        _data.push_back(val);
54
        _sift_up(_data.size() - 1);
55
    }
56

57
    // 取堆顶 → O(1)
58
    const T& top() const { return _data.front(); }
59

60
    // 弹出堆顶 → O(log n)
61
    void pop() {
62
        _data.front() = _data.back();
63
        _data.pop_back();
64
        if (!_data.empty()) _sift_down(0);
65
    }
66

67
    std::size_t size() const { return _data.size(); }
68
    bool empty() const { return _data.empty(); }
69
};

`std::priority_queue` 接口回顾#

在第 4 章（队列）中已详细介绍过。这里回顾关键要点：

1
#include <queue>
2

3
// 最大堆（默认）
4
std::priority_queue<int> max_pq;
5
max_pq.push(3);
6
max_pq.push(1);
7
max_pq.push(4);
8
max_pq.top();  // 4
9
max_pq.pop();  // 弹出 4
10

11
// 最小堆（传 greater）
12
std::priority_queue<int, std::vector<int>, std::greater<int>> min_pq;
13
min_pq.push(3);
14
min_pq.push(1);
15
min_pq.push(4);
16
min_pq.top();  // 1
17

18
// 自定义比较
19
auto cmp = [](const auto& a, const auto& b) { return a.cost > b.cost; };
20
std::priority_queue<Edge, std::vector<Edge>, decltype(cmp)> pq(cmp);

std::priority_queue 的局限：

不支持的操作	说明	解决方案
`decrease_key`	修改已有元素的优先级	索引堆 / lazy deletion
`erase`	删除指定元素	lazy deletion（标记删除）
遍历	只能访问堆顶	维护额外数据结构
合并两个堆		直接 merge 再 buildHeap O(n)

STL 堆操作族#

<algorithm> 中有一组直接在数组上操作堆的函数：

1
#include <algorithm>
2
#include <vector>
3

4
std::vector<int> v = {3, 1, 4, 1, 5, 9, 2, 6};
5

6
// 建堆 → O(n)
7
std::make_heap(v.begin(), v.end());
8
// v = [9, 6, 4, 1, 5, 3, 2, 1]
9

10
// 入堆 → 先 push_back，再 push_heap → O(log n)
11
v.push_back(8);
12
std::push_heap(v.begin(), v.end());
13
// v = [9, 8, 4, 6, 5, 3, 2, 1, 1]
14

15
// 出堆 → 先 pop_heap（把最大值换到末尾），再 pop_back → O(log n)
16
std::pop_heap(v.begin(), v.end());
17
v.pop_back();
18
// v = [8, 6, 4, 1, 5, 3, 2, 1]
19

20
// 堆排序 → O(n log n)
21
std::sort_heap(v.begin(), v.end());
22
// v = [1, 1, 2, 3, 4, 5, 6, 8]
23

24
// 检查是否是堆
25
bool is_heap = std::is_heap(v.begin(), v.end());

💡 priority_queue vs make_heap：priority_queue 是封装好的容器适配器，更安全。make_heap 系列函数直接操作数组，更灵活（可以访问任意元素、自定义排列）。

6.4.4 堆排序 (Heap Sort)#

算法流程#

1
Step 1: 将数组原地建成最大堆 → O(n)
2
Step 2: 不断"取最大值放到末尾"：
3
  - 交换 heap[0]（最大值）和 heap[n-1]（末尾）
4
  - 堆大小减 1
5
  - 对堆顶做 sift-down
6
  - 重复直到堆大小为 1
7
→ 总计 O(n log n)

C++ 实现#

1
void heapSort(std::vector<int>& arr) {
2
    int n = arr.size();
3

4
    // Step 1: 建堆（自底向上 sift-down）
5
    for (int i = n / 2 - 1; i >= 0; --i) {
6
        _siftDown(arr, n, i);
7
    }
8

9
    // Step 2: 逐个取出最大值
10
    for (int i = n - 1; i > 0; --i) {
11
        std::swap(arr[0], arr[i]);  // 最大值放末尾
12
        _siftDown(arr, i, 0);       // 缩小堆范围，修复堆顶
13
    }
14
}
15

16
void _siftDown(std::vector<int>& arr, int heap_size, int i) {
17
    while (true) {
18
        int largest = i;
19
        int l = 2 * i + 1;
20
        int r = 2 * i + 2;
21

22
        if (l < heap_size && arr[l] > arr[largest]) largest = l;
23
        if (r < heap_size && arr[r] > arr[largest]) largest = r;
24

25
        if (largest == i) break;
26

27
        std::swap(arr[i], arr[largest]);
28
        i = largest;
29
    }
30
}

堆排序 vs 其他排序#

排序算法	平均	最坏	空间	稳定	特点
快速排序	O(n log n)	O(n²)	O(log n)	❌	实际最快（cache 友好）
归并排序	O(n log n)	O(n log n)	O(n)	✅	稳定，适合链表/外部排序
堆排序	O(n log n)	O(n log n)	O(1)	❌	原地 + 最坏保证
`std::sort`	O(n log n)	O(n log n)	O(log n)	❌	IntroSort（快排+堆排混合）

💡 堆排序的独特价值：它是唯一同时具有 O(n log n) 最坏保证 和 O(1) 额外空间 的排序算法。实际中不如快排快（cache 不友好——sift-down 跳跃访问），但 std::sort（IntroSort）在快排退化时会切换到堆排序作为保底。

6.4.5 索引堆 (Indexed Heap)#

标准堆不支持”修改某个元素的优先级”（decrease_key）。索引堆通过维护一个位置映射表解决这个问题——Dijkstra 最短路算法就需要它。

1
// 索引最小堆：支持 decrease_key
2
class IndexedMinHeap {
3
    int _capacity;
4
    int _size = 0;
5

6
    std::vector<int> _heap;      // heap[i] = 原始数组中的下标
7
    std::vector<int> _pos;       // pos[id] = id 在堆中的位置（-1 = 不在堆中）
8
    std::vector<int> _keys;      // keys[id] = id 对应的优先级
9

10
    void _swap_heap(int i, int j) {
11
        _pos[_heap[i]] = j;
12
        _pos[_heap[j]] = i;
13
        std::swap(_heap[i], _heap[j]);
14
    }
15

16
    void _sift_up(int i) {
17
        while (i > 0) {
18
            int parent = (i - 1) / 2;
19
            if (_keys[_heap[i]] < _keys[_heap[parent]]) {
20
                _swap_heap(i, parent);
21
                i = parent;
22
            } else break;
23
        }
24
    }
25

26
    void _sift_down(int i) {
27
        while (2 * i + 1 < _size) {
28
            int child = 2 * i + 1;
29
            if (child + 1 < _size && _keys[_heap[child + 1]] < _keys[_heap[child]])
30
                ++child;
31
            if (_keys[_heap[i]] <= _keys[_heap[child]]) break;
32
            _swap_heap(i, child);
33
            i = child;
34
        }
35
    }
36

37
public:
38
    IndexedMinHeap(int capacity)
39
        : _capacity(capacity), _heap(capacity), _pos(capacity, -1),
40
          _keys(capacity, INT_MAX) {}
41

42
    bool contains(int id) const { return _pos[id] != -1; }
43
    bool empty() const { return _size == 0; }
44

45
    void push(int id, int key) {
46
        _keys[id] = key;
47
        _heap[_size] = id;
48
        _pos[id] = _size;
49
        _sift_up(_size++);
50
    }
51

52
    std::pair<int, int> top() const {
53
        return {_heap[0], _keys[_heap[0]]};
54
    }
55

56
    std::pair<int, int> pop() {
57
        int id = _heap[0];
58
        int key = _keys[id];
59
        _swap_heap(0, --_size);
60
        _pos[id] = -1;
61
        _sift_down(0);
62
        return {id, key};
63
    }
64

65
    // 关键操作：修改优先级 → O(log n)
66
    void decrease_key(int id, int new_key) {
67
        _keys[id] = new_key;
68
        _sift_up(_pos[id]);  // 优先级变小（更优先）→ 上浮
69
    }
70
};

用于 Dijkstra：

1
std::vector<int> dijkstra(const Graph& g, int src) {
2
    int n = g.size();
3
    std::vector<int> dist(n, INT_MAX);
4
    dist[src] = 0;
5

6
    IndexedMinHeap pq(n);
7
    pq.push(src, 0);
8

9
    while (!pq.empty()) {
10
        auto [u, d] = pq.pop();
11
        if (d > dist[u]) continue;
12

13
        for (auto [v, w] : g[u]) {
14
            if (dist[u] + w < dist[v]) {
15
                dist[v] = dist[u] + w;
16
                if (pq.contains(v))
17
                    pq.decrease_key(v, dist[v]);  // ← 关键！
18
                else
19
                    pq.push(v, dist[v]);
20
            }
21
        }
22
    }
23
    return dist;
24
}

💡 没有索引堆怎么办？ 实际竞赛和面试中，常用 lazy deletion（懒删除）代替：直接往 priority_queue 里重复推入 {new_dist, v}，弹出时检查是否过时。简单但空间 O(m)。

6.4.6 面试高频题#

第 K 大元素 (LeetCode 215)#

在未排序的数组中找到第 k 大的元素。

方法一：最小堆（大小为 K）

1
int findKthLargest(std::vector<int>& nums, int k) {
2
    // 维护大小为 k 的最小堆
3
    // 堆顶就是第 k 大
4
    std::priority_queue<int, std::vector<int>, std::greater<int>> min_pq;
5

6
    for (int num : nums) {
7
        min_pq.push(num);
8
        if (static_cast<int>(min_pq.size()) > k) {
9
            min_pq.pop();  // 弹出最小的，保持堆大小 = k
10
        }
11
    }
12
    return min_pq.top();
13
}
14
// 时间 O(n log k), 空间 O(k)

方法二：快速选择（QuickSelect）

1
int findKthLargest_quick(std::vector<int>& nums, int k) {
2
    // 第 k 大 = 第 (n-k) 小 (0-indexed)
3
    int target = nums.size() - k;
4
    return _quickSelect(nums, 0, nums.size() - 1, target);
5
}
6

7
int _quickSelect(std::vector<int>& nums, int lo, int hi, int target) {
8
    int pivot = nums[lo + rand() % (hi - lo + 1)];
9
    int i = lo, j = lo, k = hi;
10

11
    // 三路划分：[< pivot | == pivot | > pivot]
12
    while (j <= k) {
13
        if (nums[j] < pivot) std::swap(nums[i++], nums[j++]);
14
        else if (nums[j] > pivot) std::swap(nums[j], nums[k--]);
15
        else ++j;
16
    }
17

18
    if (target < i) return _quickSelect(nums, lo, i - 1, target);
19
    if (target > k) return _quickSelect(nums, k + 1, hi, target);
20
    return nums[target];
21
}
22
// 时间 O(n) 平均, O(n²) 最坏; 空间 O(1)

方法	时间	空间	特点
排序	O(n log n)	O(1)	最简单
最小堆	O(n log k)	O(k)	适合数据流
快速选择	O(n) 平均	O(1)	最快但最坏 O(n²)
`std::nth_element`	O(n) 平均	O(1)	STL 版快速选择

数据流的中位数 (LeetCode 295) —— 双堆经典#

设计一个数据结构，支持 addNum(int num) 和 findMedian() 两个操作。

🧠 思路推导（面试时怎么想到的）：

1
Step 1: 暴力想法
2
  每次 addNum 插入排序数组, findMedian 取中间 → addNum O(n), findMedian O(1)
3
  或者: addNum O(1) 直接追加, findMedian 时排序取中间 → findMedian O(n log n)
4
  都太慢。
5

6
Step 2: 目标复杂度
7
  addNum O(log n), findMedian O(1) → 需要始终维护"有序性的部分信息"
8

9
Step 3: 关键洞察
10
  中位数把数据分成"较小的一半"和"较大的一半"。
11
  我不需要两半各自完全有序, 只需要知道:
12
    - 较小半的最大值 (小半里最接近中间的)
13
    - 较大半的最小值 (大半里最接近中间的)
14

15
  "最大值" → 最大堆!  "最小值" → 最小堆!
16

17
Step 4: 双堆方案
18
  最大堆 lo: 存较小的一半 (堆顶 = 小半的最大值)
19
  最小堆 hi: 存较大的一半 (堆顶 = 大半的最小值)
20

21
  保持: lo.size() == hi.size() 或 lo.size() == hi.size() + 1
22
  中位数: lo.size() > hi.size() → lo.top()
23
           否则 → (lo.top() + hi.top()) / 2
24

25
Step 5: 插入逻辑
26
  新数先入 lo → lo 的最大值转入 hi → 如果 hi 多了再转回 lo
27
  这 3 步保证: lo 的每个元素 ≤ hi 的每个元素, 且大小平衡

核心思路：用一个最大堆存较小的一半，一个最小堆存较大的一半。中位数从两个堆顶取。

1
class MedianFinder {
2
    // 最大堆：存较小的一半（堆顶 = 较小半的最大值）
3
    std::priority_queue<int> lo;
4
    // 最小堆：存较大的一半（堆顶 = 较大半的最小值）
5
    std::priority_queue<int, std::vector<int>, std::greater<int>> hi;
6

7
public:
8
    void addNum(int num) {
9
        lo.push(num);                // 先放入较小半
10
        hi.push(lo.top());           // 把最大值转到较大半
11
        lo.pop();
12

13
        // 保持 lo.size() >= hi.size()（lo 可以多一个）
14
        if (lo.size() < hi.size()) {
15
            lo.push(hi.top());
16
            hi.pop();
17
        }
18
    }
19

20
    double findMedian() {
21
        if (lo.size() > hi.size()) {
22
            return lo.top();  // 奇数个 → lo 堆顶
23
        }
24
        return (lo.top() + hi.top()) / 2.0;  // 偶数个 → 两堆顶的均值
25
    }
26
};
27
// addNum: O(log n), findMedian: O(1)

图解（依次插入 [5, 3, 8, 1, 4]）：

1
add(5): lo=[5], hi=[]          median=5
2
add(3): lo=[3], hi=[5]         median=(3+5)/2=4
3
add(8): lo=[5,3], hi=[8]       median=5
4
add(1): lo=[3,1], hi=[5,8]     median=(3+5)/2=4
5
add(4): lo=[4,3,1], hi=[5,8]   median=4

💡 面试金句：「双堆维护有序性——最大堆的堆顶 ≤ 最小堆的堆顶。这样中位数就在两个堆顶之间。每次插入 O(log n)，查询中位数 O(1)。」

合并 K 个有序链表 (LeetCode 23)#

合并 k 个排序链表，返回合并后的排序链表。

1
ListNode* mergeKLists(std::vector<ListNode*>& lists) {
2
    auto cmp = [](ListNode* a, ListNode* b) { return a->val > b->val; };
3
    std::priority_queue<ListNode*, std::vector<ListNode*>, decltype(cmp)> pq(cmp);
4

5
    // 把每个链表的头节点放入最小堆
6
    for (auto* head : lists) {
7
        if (head) pq.push(head);
8
    }
9

10
    ListNode dummy(0);
11
    ListNode* tail = &dummy;
12

13
    while (!pq.empty()) {
14
        ListNode* node = pq.top();
15
        pq.pop();
16

17
        tail->next = node;
18
        tail = node;
19

20
        if (node->next) pq.push(node->next);
21
    }
22

23
    return dummy.next;
24
}
25
// 时间 O(N log k), N = 总节点数, k = 链表数
26
// 空间 O(k)

这道题在第 2 章（链表）中用分治做过。这里用堆来做——核心思想：始终从 k 个链表的当前头节点中取最小的。堆维护这 k 个候选节点。

前 K 个高频元素 (LeetCode 347)#

给定非空整数数组，返回其中出现频率前 k 高的元素。

1
std::vector<int> topKFrequent(std::vector<int>& nums, int k) {
2
    // 1. 统计频率
3
    std::unordered_map<int, int> freq;
4
    for (int n : nums) ++freq[n];
5

6
    // 2. 最小堆维护 top-k
7
    auto cmp = [](const auto& a, const auto& b) { return a.second > b.second; };
8
    std::priority_queue<std::pair<int,int>, std::vector<std::pair<int,int>>,
9
                        decltype(cmp)> pq(cmp);
10

11
    for (auto& [num, count] : freq) {
12
        pq.push({num, count});
13
        if (static_cast<int>(pq.size()) > k) pq.pop();
14
    }
15

16
    // 3. 提取结果
17
    std::vector<int> result;
18
    while (!pq.empty()) {
19
        result.push_back(pq.top().first);
20
        pq.pop();
21
    }
22
    return result;
23
}
24
// 时间 O(n log k), 空间 O(n)

最接近原点的 K 个点 (LeetCode 973)#

给定平面上 n 个点，找出最接近原点的 k 个。

1
std::vector<std::vector<int>> kClosest(
2
    std::vector<std::vector<int>>& points, int k)
3
{
4
    // 最大堆维护最近 k 个（堆顶 = 第 k 近 = k 个中最远的）
5
    auto dist = [](const std::vector<int>& p) {
6
        return p[0] * p[0] + p[1] * p[1];  // 不用开方，比较平方即可
7
    };
8

9
    auto cmp = [&](const std::vector<int>& a, const std::vector<int>& b) {
10
        return dist(a) < dist(b);  // 最大堆
11
    };
12

13
    std::priority_queue<std::vector<int>, std::vector<std::vector<int>>,
14
                        decltype(cmp)> pq(cmp);
15

16
    for (auto& p : points) {
17
        pq.push(p);
18
        if (static_cast<int>(pq.size()) > k) pq.pop();
19
    }
20

21
    std::vector<std::vector<int>> result;
22
    while (!pq.empty()) {
23
        result.push_back(pq.top());
24
        pq.pop();
25
    }
26
    return result;
27
}
28
// 时间 O(n log k), 空间 O(k)

💡 Top-K 问题的通用模板：用大小为 K 的堆。找最大 K 个用最小堆（淘汰最小的），找最小 K 个用最大堆（淘汰最大的）。理由：堆顶是”最危险的”——第 K+1 个元素来了，和堆顶比，如果更优就替换堆顶。

6.4.7 面试题速查表#

题号	题目	核心技巧	难度
LC 215	第 K 大元素	最小堆 / 快速选择	Medium
LC 295	数据流中位数	双堆（大顶 + 小顶）	Hard
LC 23	合并 K 个有序链表	最小堆 k 路归并	Hard
LC 347	前 K 个高频元素	哈希 + 最小堆	Medium
LC 973	最接近原点的 K 个点	最大堆维护 K 个	Medium
LC 703	数据流中第 K 大元素	最小堆 size=k	Easy
LC 378	有序矩阵中第 K 小	最小堆 / 二分	Medium
LC 767	重组字符串	最大堆贪心	Medium
LC 1046	最后一块石头的重量	最大堆模拟	Easy
LC 355	设计推特	哈希 + 最小堆归并	Medium
—	堆排序	buildHeap + 逐个 pop	手写
—	索引堆	decrease_key + Dijkstra	进阶

6.4.8 本节小结#

核心要点#

概念	要点
堆	完全二叉树 + 堆序性，用数组存储
sift-up	插入时用——新元素追加到末尾后上浮
sift-down	删除堆顶时用——末尾元素放顶部后下沉
buildHeap	自底向上 sift-down → O(n)
堆排序	原地 O(n log n)，最坏也是 O(n log n)，std::sort 的保底方案
Top-K	大小为 K 的堆。找最大 K 个用最小堆，找最小 K 个用最大堆
双堆	数据流中位数——最大堆存小半，最小堆存大半
索引堆	支持 decrease_key，用于 Dijkstra

面试 30 秒速答#

Q：堆的插入和删除是怎么做的？
A：插入：新元素追加到数组末尾，然后 sift-up（和父节点比较，更大就向上交换），O(log n)。删除堆顶：用末尾元素替换堆顶，然后 sift-down（和较大的子节点比较，更小就向下交换），O(log n)。

Q：如何从 n 个元素中找第 K 大？
A：三种方法：(1) 排序 O(n log n)；(2) 大小为 K 的最小堆 O(n log k)——遍历数组，每个元素入堆，堆大小超过 K 就 pop；(3) 快速选择 O(n) 平均。面试中优先写堆解法（稳定、好写），再提快速选择作为优化。

Q：堆排序为什么实际比快排慢？
A：虽然堆排序最坏也是 O(n log n)，但它的 cache 命中率差——sift-down 跳跃式访问数组（从 i 到 2i+1），不像快排那样顺序扫描。std::sort 用的 IntroSort = 快排 + 堆排切换：正常用快排（快），快排退化时切到堆排（保证最坏 O(n log n)）。

📖 上一节：6.3 平衡树：AVL 与红黑树
📖 下一节：6.5 线段树 & 树状数组 —— 区间查询与修改的利器，懒传播与树状数组的 lowbit 技巧。

音乐

音乐

6.4 堆与优先队列#

6.4.1 概念与性质#

完全二叉树 + 堆序性#

数组存储 —— 堆的精髓#

堆 ≠ BST#

6.4.2 核心操作#

sift-up（上浮）—— 插入时用#

sift-down（下沉）—— 删除最大值时用#

buildHeap —— O(n) 建堆#

6.4.3 C++ 实现#

手写最大堆#

`std::priority_queue` 接口回顾#

STL 堆操作族#

6.4.4 堆排序 (Heap Sort)#

算法流程#

C++ 实现#

堆排序 vs 其他排序#

6.4.5 索引堆 (Indexed Heap)#

6.4.6 面试高频题#

第 K 大元素 (LeetCode 215)#

数据流的中位数 (LeetCode 295) —— 双堆经典#

合并 K 个有序链表 (LeetCode 23)#

前 K 个高频元素 (LeetCode 347)#

最接近原点的 K 个点 (LeetCode 973)#

6.4.7 面试题速查表#

6.4.8 本节小结#

核心要点#

面试 30 秒速答#

文章分享

评论区

音乐

目录

音乐

音乐

6.4 堆与优先队列

6.4 堆与优先队列#

6.4.1 概念与性质#

完全二叉树 + 堆序性#

数组存储 —— 堆的精髓#

堆 ≠ BST#

6.4.2 核心操作#

sift-up（上浮）—— 插入时用#

sift-down（下沉）—— 删除最大值时用#

buildHeap —— O(n) 建堆#

6.4.3 C++ 实现#

手写最大堆#

std::priority_queue 接口回顾#

STL 堆操作族#

6.4.4 堆排序 (Heap Sort)#

算法流程#

C++ 实现#

堆排序 vs 其他排序#

6.4.5 索引堆 (Indexed Heap)#

6.4.6 面试高频题#

第 K 大元素 (LeetCode 215)#

数据流的中位数 (LeetCode 295) —— 双堆经典#

合并 K 个有序链表 (LeetCode 23)#

前 K 个高频元素 (LeetCode 347)#

最接近原点的 K 个点 (LeetCode 973)#

6.4.7 面试题速查表#

6.4.8 本节小结#

核心要点#

面试 30 秒速答#

文章分享

评论区

音乐

目录

`std::priority_queue` 接口回顾#