python的urlparse

urlparse主要是URL的分解和拼接,分析出URL中的各项参数,能够被其余的URL使用。python

主要的函数有:服务器

一、urlparse函数

将URL分解为6个片断,返回一个元组,包括协议、基地址、相对地址等等url

import urlparse  
url = urlparse.urlparse('http://blog.csdn.net/?ref=toolbar')  
print url  

输出结果为:.net

ParseResult(scheme='http', netloc='blog.csdn.NET', path='/', params='', query='ref=toolbar', fragment='')blog

scheme是协议,netloc是服务器地址,path是相对路径,params是参数,query是查询的条件。字符串

若是知道服务器的地址的话,能够以服务器的地址为基地址,拼接其余的相对路径,组成新的URL。get

二、urlsplitit

和urlparse的做用差很少,将URL分解为5个片断,返回一个元组。返回一个包含5个字符串项目的元组:协议、位置、路径、查询、片断。class

import urlparse  
url = urlparse.urlsplit('http://blog.csdn.net/?ref=toolbar')  
print url  

运行结果为:

SplitResult(scheme='http', netloc='blog.csdn.net', path='/', query='ref=toolbar', fragment='')

三、urljoin

基地址和相对地址的拼接。

urlparse.urljoin(base, url[, allow_fragments])

四、urlunparse

和urlparse的效果相反,能够把6个部分拼接起来。

相关文章
相关标签/搜索