其他

Python中的zip函数：高效合并与处理多个列表的利器

悠悠楠杉

2025-12-06

0 评论

67 阅读

正在检测是否收录...

12/06

正文：

在日常编程中，我们经常需要同时处理多个列表的数据。比如合并用户信息表、同步处理坐标数据，或者配对商品与价格。这时候，Python内置的zip()函数就像一把瑞士军刀，能优雅地解决这类问题。

zip函数的基本原理

zip()函数接收多个可迭代对象作为参数，将它们像拉链的齿一样一一配对。它会创建一个迭代器，每次迭代返回一个元组，其中包含每个可迭代对象当前位置的元素。当最短的可迭代对象耗尽时，迭代自动停止。

# 基础用法示例
names = ["张三", "李四", "王五"]
ages = [28, 32, 25]
departments = ["研发部", "市场部", "财务部"]

# 将三个列表合并成元组序列
for name, age, dept in zip(names, ages, departments):
    print(f"{name}（{age}岁）: {dept}")

# 输出：
# 张三（28岁）: 研发部
# 李四（32岁）: 市场部
# 王五（25岁）: 财务部

处理不等长列表的陷阱

实际业务中常会遇到列表长度不一致的情况。默认情况下，zip()会以最短列表为准截断数据。这可能导致数据丢失：

prices = [99.9, 149.9]
products = ["鼠标", "键盘", "耳机"]

# 结果只会输出前两个商品
for product, price in zip(products, prices):
    print(f"{product}: ¥{price}")

# 输出：
# 鼠标: ¥99.9
# 键盘: ¥149.9

解决方案：使用itertools.zip_longest

标准库的itertools模块提供了更灵活的解决方案。zip_longest()可以填充默认值直到最长列表结束：

from itertools import zip_longest

for product, price in zip_longest(products, prices, fillvalue="价格待定"):
    print(f"{product}: ¥{price}")

# 输出：
# 鼠标: ¥99.9
# 键盘: ¥149.9
# 耳机: ¥价格待定

高级应用场景

矩阵转置
在处理二维数据时，zip(*matrix)可以快速实现行列转换：

matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

transposed = list(zip(*matrix))
# 结果：[(1, 4, 7), (2, 5, 8), (3, 6, 9)]

字典快速构建
将两个列表直接合并为字典比传统循环更简洁：

keys = ["name", "age", "city"]
values = ["Alice", 30, "New York"]

user_dict = dict(zip(keys, values))
# 结果：{'name': 'Alice', 'age': 30, 'city': 'New York'}

并行处理
在数据清洗时经常需要同时处理多个字段：

# 清洗用户输入数据
raw_names = ["  john DOE ", "mary Smith ", " SAM "]
raw_emails = ["JOHN@demo.com", " invalid-email ", " sam@example.com "]

cleaned_data = []
for name, email in zip(raw_names, raw_emails):
    cleaned_data.append((
        name.strip().title(),
        email.strip().lower() if "@" in email else None
    ))

# 结果：
# [('John Doe', 'john@demo.com'), 
#  ('Mary Smith', None), 
#  ('Sam', 'sam@example.com')]

性能优化技巧

当处理超大型数据集时，直接使用zip()返回的迭代器比转换为列表更节省内存：

# 处理百万级数据
large_list1 = range(1, 1000000)
large_list2 = range(1000000, 2000000)

# 使用迭代器避免内存爆炸
for a, b in zip(large_list1, large_list2):
    # 处理逻辑
    pass

常见问题排查

迭代器耗尽问题
zip()返回的是单次使用的迭代器，重复使用会导致空结果：

zipped = zip(names, ages)
first_pass = list(zipped)  # 正常
second_pass = list(zipped)  # 返回空列表

解决方案：需要多次使用时，应转换为列表或重新创建迭代器。

修改原列表的影响
zip()创建的是动态视图，原始列表修改会影响迭代结果：

list1 = [1, 2, 3]
list2 = ['a', 'b', 'c']
zipped = zip(list1, list2)

list1[1] = 99  # 修改原列表
print(list(zipped))  # 输出：[(1, 'a'), (99, 'b'), (3, 'c')]

最佳实践建议