Python如何获取多个li的信息

Python如何获取多个li的信息

作者:William Gu发布时间:2026-01-14阅读时长:0 分钟阅读次数:8

用户关注问题

Q
如何用Python批量获取网页中所有li标签的内容?

我想用Python爬取网页,并且提取页面中所有li标签内的文字内容,该如何操作?

A

使用BeautifulSoup解析网页并提取所有li标签内容

可以使用Python的BeautifulSoup库加载网页HTML,通过find_all('li')方法获取所有li标签,再遍历提取其文本内容。示例代码如下:

from bs4 import BeautifulSoup

html = '<ul><li>项1</li><li>项2</li><li>项3</li></ul>'
soup = BeautifulSoup(html, 'html.parser')
li_tags = soup.find_all('li')
for li in li_tags:
    print(li.get_text())
Q
如何使用Python提取含有特定属性的多个li标签?

网页中的li标签有不同属性,如何用Python筛选出含有某个class或id属性的多个li标签?

A

用BeautifulSoup结合属性过滤获取目标li标签

BeautifulSoup的find_all方法支持传入属性参数,可以筛选出带有指定class或id的li标签。例如:

li_tags = soup.find_all('li', class_='active')

上面代码会返回所有class为active的li标签列表。也可以通过attrs字典更灵活匹配其他属性。

Q
Python中如何处理获取到的多个li标签信息并保存?

提取了多个li标签的信息后,怎样用Python整理并保存这些数据?

A

用列表存储li文本并写入文件保存

遍历获取的li标签,将每个li的文本存进列表,之后可用Python的IO操作将列表内容写入文件,例如txt或csv。示例:

li_texts = [li.get_text() for li in li_tags]
with open('li_texts.txt', 'w', encoding='utf-8') as f:
    for item in li_texts:
        f.write(item + '\n')

这样即可方便后续数据处理或分析。