其他

堆排序：原理与实现步骤详解

悠悠楠杉

2025-08-22

0 评论

96 阅读

正在检测是否收录...

08/22

堆排序是一种基于完全二叉树结构的高效排序算法，兼具插入排序和归并排序的优点。本文深入讲解堆排序的核心原理、完整实现步骤及典型应用场景。

一、堆排序的核心思想

堆排序（Heap Sort）由J.W.J. Williams在1964年提出，其本质是利用二叉堆这种数据结构设计的排序算法。这种排序方式具有两大显著特征：
1. 原地排序：仅需O(1)的额外空间
2. 稳定时间复杂度：始终保证O(n log n)的性能

与快速排序相比，堆排序最突出的优势在于其最坏情况下仍能保持O(n log n)的时间复杂度，这使其成为处理大规模不稳定数据的理想选择。

二、必备概念解析

1. 二叉堆的物理结构

虽然逻辑上是二叉树，但实际存储采用数组实现。对于任意元素arr[i]：
- 父节点：arr[(i-1)/2]
- 左子节点：arr[2i+1] - 右子节点：arr[2i+2]

2. 堆的性质分类

最大堆：每个节点的值都大于等于其子节点（用于升序排序）
最小堆：每个节点的值都小于等于其子节点（用于降序排序）

三、算法实现步骤详解

步骤1：构建初始堆

从最后一个非叶子节点开始（即arr[n/2-1]），自底向上进行堆化：python
def heapify(arr, n, i):
largest = i # 初始化最大元素为根节点
left = 2 * i + 1
right = 2 * i + 2

# 比较左子节点
if left < n and arr[left] > arr[largest]:
    largest = left

# 比较右子节点
if right < n and arr[right] > arr[largest]:
    largest = right

# 如果最大值不是根节点
if largest != i:
    arr[i], arr[largest] = arr[largest], arr[i]  # 交换
    heapify(arr, n, largest)  # 递归调整受影响子树

步骤2：执行排序

将堆顶元素（最大值）与末尾元素交换
减少堆大小并重新堆化
重复直到堆大小为1

python
def heap_sort(arr):
n = len(arr)

# 构建最大堆
for i in range(n//2 - 1, -1, -1):
    heapify(arr, n, i)

# 逐个提取元素
for i in range(n-1, 0, -1):
    arr[0], arr[i] = arr[i], arr[0]  # 交换
    heapify(arr, i, 0)  # 对剩余元素重新堆化

四、时间复杂度分析

| 操作阶段 | 时间复杂度 |
|----------------|------------|
| 建堆过程 | O(n) |
| 每次堆调整 | O(log n) |
| 整体排序 | O(n log n) |

值得注意的是，虽然建堆的渐进时间复杂度是O(n)，但实际工程中这个常数因子较大，因此堆排序在数据量较小时可能不如插入排序高效。

五、实际应用场景

优先队列实现：操作系统进程调度
Top K问题：在海量数据中快速找出前K大元素
外部排序：当内存不足以加载全部数据时

六、与其他排序算法的对比

vs 快速排序：堆排序更适合处理数据动态变化的场景
vs 归并排序：堆排序是原地排序但非稳定排序
vs 插入排序：大数据量时优势明显，小数据量时可能性能反而不佳

理解堆排序不仅能掌握一种高效算法，更是学习优先级队列、图算法（如Dijkstra）等重要数据结构的基础。下次当您需要处理千万级数据排序时，不妨试试这个"空间节俭的时间管理大师"。

时间复杂度堆排序二叉树优先队列原地排序

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/36399/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权