如何用Python删除列表中的重复元素

要在Python中删除列表中的重复元素，可以使用集合（set）、字典（dictionary）以及列表推导（list comprehension）等多种方法。 在这些方法中，利用集合是最常见且简单的方法，因为集合本质上不会存储重复的元素。下面我们将详细讨论几种常用方法，并在每种方法中提供代码示例和解释。

一、使用集合（set）

集合是一种无序且不重复的数据结构。将列表转换为集合，然后再转换回列表，就能轻松地去除重复元素。

original_list = [1, 2, 2, 3, 4, 4, 5]
unique_list = list(set(original_list))
print(unique_list)

在这段代码中，我们首先将 original_list 转换为集合 set(original_list)，然后再转换回列表 list(set(original_list))。这种方法简单直接，但会打乱原来列表的顺序。如果保持顺序是必须的，那么可以考虑其他方法。

二、使用字典（dictionary）

Python 3.7及以上版本的字典是有序的，可以利用这一点来删除重复元素并保持原列表的顺序。

original_list = [1, 2, 2, 3, 4, 4, 5]
unique_list = list(dict.fromkeys(original_list))
print(unique_list)

在这段代码中，dict.fromkeys 方法会创建一个字典，其键是 original_list 中的元素，而值默认是 None。因为字典不允许键重复，因此会自动去除重复元素。最后，我们将字典的键转换回列表。

三、使用列表推导（list comprehension）

列表推导是一种简洁而高效的创建列表的方法。通过结合条件判断，可以实现去除重复元素的功能。

original_list = [1, 2, 2, 3, 4, 4, 5]
seen = set()
unique_list = [x for x in original_list if not (x in seen or seen.add(x))]
print(unique_list)

在这段代码中，我们使用一个集合 seen 来记录已经出现过的元素。对于每一个元素，如果它不在 seen 中，则将其添加到 unique_list 中，并且将其添加到 seen 中。这样就能保持列表的顺序并去除重复元素。

四、使用循环和条件判断

尽管上面的几种方法已经非常高效，但了解如何使用基本的循环和条件判断也非常有益。这种方法适用于需要更灵活控制去重逻辑的情况。

original_list = [1, 2, 2, 3, 4, 4, 5]
unique_list = []
for item in original_list:
    if item not in unique_list:
        unique_list.append(item)
print(unique_list)

在这段代码中，我们遍历 original_list 中的每一个元素，如果它不在 unique_list 中，则将其添加进去。这样可以保持列表的顺序并去除重复元素，但相对较慢，因为每次检查 item not in unique_list 都需要线性时间。

五、结合函数和装饰器

对于较复杂的去重逻辑，可以考虑将代码封装成函数或使用装饰器来简化代码结构和提高可读性。

def remove_duplicates(original_list):
    seen = set()
    return [x for x in original_list if not (x in seen or seen.add(x))]
original_list = [1, 2, 2, 3, 4, 4, 5]
unique_list = remove_duplicates(original_list)
print(unique_list)

在这段代码中，我们将去除重复元素的逻辑封装成了 remove_duplicates 函数，这样可以更方便地在其他地方调用，并且提高代码的可读性和维护性。

六、性能比较

在选择具体方法时，性能往往是一个重要的考虑因素。集合方法和字典方法通常比较快，但会打乱顺序；列表推导和循环方法虽然较慢，但可以保持顺序。可以根据实际需求进行选择。

import time
original_list = [1, 2, 2, 3, 4, 4, 5] * 1000
Using set
start_time = time.time()
unique_list_set = list(set(original_list))
print("Set method took", time.time() - start_time, "seconds")
Using dict
start_time = time.time()
unique_list_dict = list(dict.fromkeys(original_list))
print("Dict method took", time.time() - start_time, "seconds")
Using list comprehension
start_time = time.time()
seen = set()
unique_list_comp = [x for x in original_list if not (x in seen or seen.add(x))]
print("List comprehension method took", time.time() - start_time, "seconds")
Using loop
start_time = time.time()
unique_list_loop = []
for item in original_list:
    if item not in unique_list_loop:
        unique_list_loop.append(item)
print("Loop method took", time.time() - start_time, "seconds")