python如何查询并获取网页内容

作者：Joshua Lee发布时间：2026-01-14阅读时长：0 分钟阅读次数：37

用户关注问题

如何使用Python发送HTTP请求获取网页内容？

我想用Python访问一个网页并获取其HTML代码，应该用哪些库或者方法？

使用requests库发送请求

Python的requests库非常适合发送HTTP请求。通过requests.get(url)可以获取网页内容，返回的Response对象的text属性包含网页的HTML代码。示例：

import requests
response = requests.get('https://example.com')
html_content = response.text
print(html_content)

如何处理获取到的网页内容进行解析？

我拿到网页的HTML代码后，怎样用Python提取我需要的信息？

使用BeautifulSoup解析网页

BeautifulSoup是Python中常用的网页解析库。通过from bs4 import BeautifulSoup导入，创建BeautifulSoup对象后，可以方便地根据标签、类名等定位和提取所需内容。步骤是先用requests获取HTML，然后用BeautifulSoup解析。示例：

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_content, 'html.parser')
titles = soup.find_all('h1')
for title in titles:
print(title.text)

Python如何处理请求过程中可能出现的异常？

在用Python获取网页内容时，出现网络错误或响应异常怎么办？

使用异常处理保障请求稳定

网络请求可能会因连接失败、超时等问题导致异常。使用try-except结构捕获requests.exceptions中的异常，可以防止程序崩溃并做出相应处理。还可以设置timeout参数避免长时间等待。示例：

import requests
try:
response = requests.get('https://example.com', timeout=5)
response.raise_for_status() # 检查响应状态
print(response.text)
except requests.exceptions.RequestException as e:
print(f'请求出现错误: {e}')

标签：

编程数据采集网络请求