python中如何找到重复的数据

作者：Joshua Lee发布时间：2026-01-14阅读时长：0 分钟阅读次数：30

用户关注问题

如何使用Python查找列表中的重复元素？

我有一个Python列表，想找出里面有哪些元素是重复出现的，有没有简单的方法来实现？

在Python中查找列表重复元素的方法

可以利用collections模块中的Counter类来统计列表元素出现的次数，然后筛选出出现次数大于1的元素。例如：

from collections import Counter
items = [1, 2, 2, 3, 4, 4, 4]
counter = Counter(items)
duplicates = [item for item, count in counter.items() if count > 1]
print(duplicates)  # 输出：[2, 4]

有没有办法用Pandas库找出数据框中重复的行？

我在处理DataFrame时需要找出那些重复的行，Pandas提供哪些工具帮助完成这一操作？

利用Pandas查找DataFrame中的重复行

Pandas的duplicated()函数能标记DataFrame中重复的行，可以选择保留第一次出现还是最后一次。例如：

import pandas as pd

df = pd.DataFrame({'A':[1,2,2,3], 'B':[4,5,5,6]})
duplicates = df[df.duplicated()]
print(duplicates)

该代码会输出所有重复的行。duplicated()函数默认保留第一次出现的行，将后续重复行标记为True。

怎样用Python的集合(set)来识别重复元素？

我听说用集合能快速去重，想知道怎样通过集合找出列表中重复出现的元素？

使用集合找出列表重复项的技巧

虽然集合能快速去除重复元素，但直接用集合无法找出重复的元素。可以用两个集合来实现：
一个集合用来存放已出现过的元素，另一个集合用来存放重复元素。示例如下：

items = [1, 2, 2, 3, 4, 4, 5]
seen = set()
duplicates = set()
for item in items:
    if item in seen:
        duplicates.add(item)
    else:
        seen.add(item)
print(list(duplicates))  # 输出：[2, 4]

标签：

数据处理编程语言自动化