其他

Python列表去重：原地移除重复元素详解

悠悠楠杉

2025-11-20

0 评论

1 阅读

正在检测是否收录...

11/20

深入探讨在不使用额外空间的前提下，如何在 Python 中实现列表的原地去重，分析多种方法的优劣与适用场景。

在 Python 编程中，列表（list）是最常用的数据结构之一。然而，在实际开发过程中，我们经常会遇到列表中包含重复元素的情况。虽然有多种方式可以去除重复项，但如果要求“原地”操作——即不创建新列表、直接修改原列表以节省内存——问题就变得更具挑战性。

所谓“原地去重”，是指在不分配额外存储空间（或仅使用常量级额外空间）的情况下，直接修改原始列表，使其只保留唯一的元素，且保持原有顺序。这在处理大规模数据或对内存敏感的场景中尤为重要。

最直观的想法是遍历列表，一旦发现重复元素就调用 remove() 方法。例如：

python def remove_duplicates_naive(lst): i = 0 while i < len(lst): if lst[i] in lst[:i]: lst.remove(lst[i]) else: i += 1

这种方法逻辑清晰，但效率极低。原因在于每次调用 remove() 都需要从列表中查找并删除元素，而列表删除操作的时间复杂度为 O(n)，整个算法最坏情况下会达到 O(n³)。对于长度较大的列表，性能将急剧下降，显然不可取。

为了提升效率，我们可以考虑使用集合（set）来记录已出现的元素，同时采用双指针技术进行原地覆盖。虽然严格意义上这仍需 O(n) 的额外空间用于集合，但列表本身的修改是原地完成的，符合“原地修改”的工程实践需求。

python def remove_duplicates_set(lst): if not lst: return seen = set() write_index = 0 for read_index in range(len(lst)): if lst[read_index] not in seen: seen.add(lst[read_index]) lst[write_index] = lst[read_index] write_index += 1 del lst[write_index:]

该方法时间复杂度为 O(n)，利用写指针 write_index 将不重复的元素“压缩”到列表前端，最后通过切片删除多余部分。虽然使用了集合，但在大多数实际应用中是可以接受的折中方案。

如果我们坚持完全不用额外数据结构，就必须牺牲时间换空间。一种可行策略是嵌套循环，对每个元素检查其之前是否已存在：

python def remove_duplicates_no_extra_space(lst): write_index = 0 for i in range(len(lst)): is_duplicate = False for j in range(write_index): if lst[i] == lst[j]: is_duplicate = True break if not is_duplicate: lst[write_index] = lst[i] write_index += 1 del lst[write_index:]

这种方法空间复杂度为 O(1)，但时间复杂度高达 O(n²)，仅适用于小规模数据。

还有一种思路是先排序再去重，但这会破坏原有顺序，通常不符合“保持顺序”的要求。例如：

python
lst.sort()

然后使用双指针合并相邻重复项

虽然高效，但改变了原始数据的排列，因此在多数去重场景中并不适用。

综上所述，真正的“完美”原地去重——即 O(n) 时间、O(1) 额外空间、保持顺序——在一般情况下无法实现，因为判断元素是否重复必须依赖某种记忆机制，而这不可避免地需要额外存储。

在实际开发中，推荐使用基于集合的双指针法。它在时间效率和代码可读性之间取得了良好平衡，且原列表被真正修改，符合“原地”语义。若对内存极其敏感，可评估数据规模后选择嵌套循环法，但应避免在大数据集上使用。

值得注意的是，Python 的列表设计本身是动态数组，频繁删除元素会导致大量数据搬移。因此，即使使用 del 或 pop，也应尽量减少中间操作次数。最佳实践是先收集所有要保留的元素索引，最后统一裁剪。

总之，列表原地去重并非一个简单的任务，它涉及时间与空间的权衡、顺序的保持以及语言特性的理解。掌握不同方法的边界条件与性能特征，才能在真实项目中做出合理选择。

内存优化 Python 列表去重原地操作 remove 集合双指针

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/38851/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权

至尊技术网

Python列表去重：原地移除重复元素详解

然后使用双指针合并相邻重复项

人生倒计时

最新回复

标签云