怎么统计单词数Python

怎么统计单词数Python

作者:Elara发布时间:2026-03-25阅读时长:0 分钟阅读次数:2

用户关注问题

Q
如何使用Python计算一段文本中的单词数量?

我有一段文本,想要用Python代码来统计其中的单词数,应该怎么操作?

A

利用字符串分割方法统计单词数

可以通过Python的字符串split()方法将文本按空白字符分割成单词列表,然后使用len()函数获取单词数。示例代码:

text = "这是一个示例文本。"
words = text.split()
word_count = len(words)
print(f"单词数为:{word_count}")

这种方式适用于用空格分隔的英文文本。

Q
统计Python代码中的单词数时如何处理标点符号?

如果文本中含有标点符号,这些符号会影响单词统计吗?需要如何处理?

A

剔除标点符号提升单词统计准确性

标点符号可能粘连在单词上,导致统计不准确。可以使用Python的string模块中的punctuation来去除标点符号,示例如下:

import string
text = "Hello, world! This is an example."
text_clean = text.translate(str.maketrans('', '', string.punctuation))
words = text_clean.split()
print(f"单词数为:{len(words)}")

去除标点后,再统计单词数更准确。

Q
如何用Python统计文本中不同单词出现的频率?

除了计算总单词数,我还想知道每个单词出现了多少次,怎么实现?

A

使用collections模块的Counter统计单词频率

Python的collections模块提供了Counter类,可以方便地统计每个单词出现次数,示例如下:

from collections import Counter
text = "hello world hello python"
words = text.split()
counter = Counter(words)
print(counter)

输出结果是每个单词的频数,适合进行更细粒度的词频分析。