Python3 URL解析库 — urlparse

时间 2020-06-14

标签 python3 python url 解析 urlparse 栏目 Python 繁體版

原文原文链接

docs.python.org/zh-cn/3.8/l…html

解析一个 URL 得到各个概念所对应的值在 Python 中显得很简单, Python3 中将 urllib2、urlparse 和 robotparse 并入了 urllib 模块中, 因此本来在 Python 导入的方式在 Python3 中应该这样导入：python

from urllib.parse import urlparse
复制代码

使用它咱们能够得到 ParseResult 对象, 咱们能够经过下标或者属性名来访问对象属性：函数

scheme (协议)
netloc (域名)
path (路径)
params (可选参数)
query (链接键值对)
fragment (特殊锚)

属性名	索引值	说明	空值状况下表达
scheme	0	URL 协议	`""`
netloc	1	URL 域名	`""`
path	2	URL 请求路径	`""`
params	3	URL 可选参数	`""`
query	4	URL 键值对参数	`""`
fragment	5	URL 特殊锚	`""`
username		用户名	`None`
password		密码	`None`
hostname		主机名(小写)	`None`
port		若是存在, 则是整数端口号	`None`

咱们测试下这个函数的使用：post

#!/usr/bin/env python
# _*_ Coding: UTF-8 _*_
from urllib.parse import urlparse

result = urlparse('https://juejin.im/user/5da32395e51d4578200cc9c5/posts?params=123&username=123')
print(result)
复制代码

输出的结果是：测试

ParseResult(
    scheme='https', 
    netloc='juejin.im', 
    path='/user/5da32395e51d4578200cc9c5/posts', 
    params='', 
    query='params=123&username=123', 
    fragment=''
)
复制代码