python爬虫 (一) 爬虫基础了解,urllib

• URL的含义:网站

统一资源定位符,结构:url

URL的格式由三部分组成:
①第一部分是协议(或称为服务方式)。
②第二部分是存有该资源的主机IP地址(有时也包括端口号)。
③第三部分是主机资源的具体地址,如目录和文件名等。资源

关于URL和URI的区别:https://www.zhihu.com/question/21950864io

• 环境的配置import

IDE的选择。登录

 

Φ urllib配置

 

import urllib.requestrequest

response=urllib.request.urlopen("http://www.baidu.com",data,8000);程序

print response.read()im

 

构造Request.

import urllib.request

request = urllib.Request("http://www.baidu.com")
response = urllib.urlopen(request)

print response.read()

 

ΦGET和POST

上面的程序演示了最基本的网页抓取,不过,如今大多数网站都是动态网页,须要你动态地传递参数给它,它作出对应的响应。因此,在访问时,咱们须要传递数据给它。最多见的状况是什么?对了,就是登陆注册的时候呀

相关文章
相关标签/搜索