python如何从列表中提取单词

python如何从列表中提取单词

作者:William Gu发布时间:2026-01-14阅读时长:0 分钟阅读次数:35

用户关注问题

Q
如何从包含句子的列表中提取所有单词?

我有一个列表,里面是多个句子组成的字符串,怎样能够提取出所有的单词?

A

使用字符串方法和列表推导实现单词提取

可以通过遍历列表中的每个句子,使用字符串的split()方法将句子分割成单词,再收集所有单词到一个新的列表中。例如:words = [word for sentence in sentences for word in sentence.split()]。这样就能提取出所有单词。

Q
有没有办法去除列表中文本的标点符号,只留下单词?

我想从列表中的字符串里提取纯单词,不包含逗号、句号等标点符号,该怎么做?

A

结合正则表达式去除标点符号提取单词

可以使用Python的re模块中的re.findall()函数,结合正则表达式\w+来提取单词,比如:import re; words = [re.findall(r'\w+', sentence) for sentence in sentences],这样能提取出每行文本的所有单词,而自动忽略标点。

Q
如何提取列表中所有单词并保证结果不重复?

我想从列表里的句子中提取所有单词,并且不想要重复的单词,应该怎样处理?

A

使用集合去重后提取单词

先通过列表推导式提取出所有单词,接着将结果转换成集合以去除重复项,比如:words = list(set([word for sentence in sentences for word in sentence.split()]))。这样得到的words列表中每个单词都是唯一的。