python怎么判断网址域名

作者：Joshua Lee发布时间：2026-03-25阅读时长：0 分钟阅读次数：3

用户关注问题

如何使用Python提取网址中的域名？

我有一个完整的网址字符串，想用Python代码提取出它的域名部分，应该用什么方法？

Python提取网址域名的方法

可以使用Python内置的urllib.parse模块中的urlparse函数，传入网址后它会返回一个包含多个部分的对象，其中的netloc属性就是域名。例如：

from urllib.parse import urlparse
url = 'https://www.example.com/path?query=1'
parsed_url = urlparse(url)
domain = parsed_url.netloc
print(domain)  # 输出 www.example.com

这样就能获得网址中的域名。

如何用Python判断一个字符串是否是有效的域名？

收到一个字符串，想确认它是不是符合域名规则，比如格式是否正确，用什么方法验证？

用正则表达式和urlparse验证域名格式

可以借助正则表达式来匹配域名的格式，或者结合urlparse解析来辅助判断。一个简单的正则示例如下：

import re
pattern = r'^(?:[a-zA-Z0-9-]{1,63}\.)+[a-zA-Z]{2,63}$'

def is_domain(domain):
    return re.match(pattern, domain) is not None

print(is_domain('example.com'))  # True
print(is_domain('invalid_domain'))  # False

正则表达式可以根据具体需求调整，用以确认字符串是否符合域名规范。

Python中如何区分网址的子域名和主域名？

想用Python代码区分网址里的子域名部分和主域名，应该怎么做？

拆分子域名与主域名的常用方法

在提取网址的netloc后，可以使用字符串分割方法将其拆分。例如，域名 www.blog.example.com 可以拆分为子域名 'www.blog' 和主域名 'example.com'。不过直接拆分可能不够准确，建议使用第三方库tldextract，它能自动识别主域名、子域名、顶级域名：

import tldextract
url = 'https://www.blog.example.co.uk/path'
ext = tldextract.extract(url)
print(ext.subdomain)  # 输出 'www.blog'
print(ext.domain)     # 输出 'example'
print(ext.suffix)     # 输出 'co.uk'

这样可以准确获得子域名和主域名信息。

标签：

编程开发网络技术数据处理