如何在Python中计算数据频率

作者：Rhett Bai发布时间：2026-01-14阅读时长：0 分钟阅读次数：52

用户关注问题

怎样使用Python快速统计数据中各元素出现的次数？

我有一组数据，想要知道每个元素出现了多少次，Python中有什么简单的方法可以实现吗？

利用collections模块中的Counter进行频率统计

Python的collections模块提供了Counter类，可以轻松统计列表或其他可迭代对象中每个元素的出现次数。只需导入Counter并传入数据列表，Counter会返回一个字典，键是元素，值是频率。例如：

from collections import Counter
data = ['a', 'b', 'a', 'c', 'b', 'a']
frequency = Counter(data)
print(frequency)

这段代码将输出每个元素的频率统计。

如何使用Pandas库计算一个数据列中每个值的频率？

我有一个DataFrame，需要知道某一列中各个值出现的频数，Pandas中有什么方便的方法吗？

调用value_counts方法得到列内唯一值出现频率

在Pandas中，可以直接对Series对象调用value_counts()方法，它会返回包含唯一值及其出现次数的Series，默认按频率降序排列。示例如下：

import pandas as pd
df = pd.DataFrame({'col': ['x', 'y', 'x', 'z', 'y', 'x']})
freq = df['col'].value_counts()
print(freq)

输出显示了每个值在该列中出现的次数，十分直观。

有没有方法能将数据频率结果转换成相对频率百分比？

我除了想知道数据中各个值出现次数外，还想知道它们各自占总数的百分比，该怎么计算？

通过设置normalize参数获取相对频率百分比

利用Pandas的value_counts()方法时，可以传递normalize=True参数，使其返回相对频率，也就是各个值出现次数占总数的比例。示例：

import pandas as pd
data = ['a', 'b', 'a', 'c', 'b', 'a']
series = pd.Series(data)
relative_freq = series.value_counts(normalize=True) * 100
print(relative_freq)

这会输出各元素频率的百分比，方便分析比例关系。

标签：

统计分析 Python应用数据处理