docs.python.org/zh-cn/3.8/l…html
解析一个 URL 得到各个概念所对应的值在 Python 中显得很简单, Python3 中将 urllib2
、urlparse
和 robotparse
并入了 urllib
模块中, 因此本来在 Python 导入的方式在 Python3 中应该这样导入:python
from urllib.parse import urlparse
复制代码
使用它咱们能够得到 ParseResult
对象, 咱们能够经过下标或者属性名来访问对象属性:函数
属性名 | 索引值 | 说明 | 空值状况下表达 |
---|---|---|---|
scheme | 0 | URL 协议 | "" |
netloc | 1 | URL 域名 | "" |
path | 2 | URL 请求路径 | "" |
params | 3 | URL 可选参数 | "" |
query | 4 | URL 键值对参数 | "" |
fragment | 5 | URL 特殊锚 | "" |
username | 用户名 | None |
|
password | 密码 | None |
|
hostname | 主机名(小写) | None |
|
port | 若是存在, 则是整数端口号 | None |
咱们测试下这个函数的使用:post
#!/usr/bin/env python
# _*_ Coding: UTF-8 _*_
from urllib.parse import urlparse
result = urlparse('https://juejin.im/user/5da32395e51d4578200cc9c5/posts?params=123&username=123')
print(result)
复制代码
输出的结果是:测试
ParseResult(
scheme='https',
netloc='juejin.im',
path='/user/5da32395e51d4578200cc9c5/posts',
params='',
query='params=123&username=123',
fragment=''
)
复制代码