Python爬虫教程-11-proxy代理IP，隐藏地址（猫眼电影）

时间 2020-05-26

标签 python 爬虫教程 proxy 代理隐藏地址猫眼栏目 Python 繁體版

原文原文链接

Python爬虫教程-11-proxy代理IP，隐藏地址（猫眼电影）

ProxyHandler处理（代理服务器），使用代理IP，是爬虫的经常使用手段，一般使用UserAgent 假装浏览器爬取仍然可能被网站封了IP，可是咱们使用代理IP就不怕它封了咱们的IP了html

获取代理IP的的网站：

www.goubanjia.com
www.xicidaili.com
使用代理来隐藏真实访问中，代理也不容许频繁访问某一个固定网站，因此，代理必定要不少不少
须要使用，从上面的网站拷贝

基本使用步骤：

1.设置代理地址
2.建立ProxyHandler
3.建立Opener
4.安装Opener
案例v11proxy文件：https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py11proxy.py

# 使用代理服务器访问猫眼
# https://maoyan.com/
from urllib import request,error

if __name__ == '__main__':

    url = "https://baidu.com/"

    # 1.设置代理地址
    proxy = {'http': '218.60.8.83:3129'}
    # 2.建立ProxyHandler
    proxy_handler = request.ProxyHandler(proxy)
    # 3.建立Opener
    opener = request.build_opener(proxy_handler)
    # 4.安装Opener
    request.install_opener(opener)

    # 下面再进行访问url就会使用代理服务器
    try:
        rsp = request.urlopen(url)
        html = rsp.read().decode()
        print(html)

    except error.HTTPError as e:
        print(e)

    except Exception as e:
        print(e)

运行结果

关于爬虫使用代理服务器，使用代理IP，就介绍到这里了，使用代理IP是爬虫的经常使用手段，好处多多git

更多文章连接：Python 爬虫随笔

<hr>- 本笔记不容许任何我的和组织转载github