如何用python将网址拆分

作者：William Gu发布时间：2026-01-07阅读时长：0 分钟阅读次数：48

用户关注问题

如何使用Python提取网址中的域名？

我有一个完整的网址，想用Python代码提取出其中的域名部分，应该怎样做？

使用Python的urllib库提取域名

可以利用Python的urllib.parse模块中的urlparse函数，将网址解析成不同的组件。通过访问解析结果的netloc属性，可以获得网址中的域名。例如：

from urllib.parse import urlparse
url = 'https://www.example.com/path/page.html'
parsed_url = urlparse(url)
domain = parsed_url.netloc
print(domain)  # 输出：www.example.com

如何在Python中拆分网址的路径和查询参数？

有没有方法能用Python拆分出一个网址的路径部分和附带的查询参数？

通过urlparse拆分路径和查询参数

使用urlparse函数可以将网址拆分为路径和查询两部分，分别对应path和query属性。例如：

from urllib.parse import urlparse
url = 'https://www.example.com/search?q=python&sort=asc'
parsed = urlparse(url)
path = parsed.path
query = parsed.query
print('路径:', path)  # 输出: /search
print('查询参数:', query)  # 输出: q=python&sort=asc

Python如何解析网址中的各个组成部分？

有哪些Python工具可以帮我将网址按照协议、主机、端口、路径等部分拆分？

使用urllib.parse模块全面解析网址

Python的urllib.parse模块提供了强大的urlparse函数，可以把网址拆分成scheme（协议）、netloc（主机和端口）、path（路径）、params（参数）、query（查询）、fragment（锚点）等字段。例如：

from urllib.parse import urlparse
url = 'https://user:pass@example.com:8080/path;params?query=abc#fragment'
result = urlparse(url)
print('协议:', result.scheme)  # https
print('主机:', result.hostname)  # example.com
print('端口:', result.port)  # 8080
print('路径:', result.path)  # /path
print('参数:', result.params)  # params
print('查询:', result.query)  # query=abc
print('锚点:', result.fragment)  # fragment

标签：

编程软件工程数据处理