python爬虫:Requests库(一)

python爬虫:Requests库(一)

from mooc网络爬虫与信息提取

下面是爬虫的基本框架

import requests


def get_test_html(url):
    try:
        r = requests.get(url, timeout=30)  # 若是时间超过30则报错
        r.raise_for_status()  # 返回的是访问状态,200则成功,不然将会报错
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return '发生异常'


if __name__ == '__main__':
    url = 'http://www.baidu.com'
    print(get_test_html(url))

基本方法的展现


post 提交的数据放到form表单里,若是data只是一个字符串则在data里面
在这里插入图片描述html

requests库的一些基本方法与属性

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

kwargs里包含的参数

params

在这里插入图片描述

data

在这里插入图片描述

json

在这里插入图片描述

headers

在这里插入图片描述

cookies auth files 等

在这里插入图片描述

timeout

在这里插入图片描述

proxies 代理

在这里插入图片描述
在这里插入图片描述