什么是python爬虫?

1、爬虫 就是给网站发起请求,并从响应中提取数据的自动化程式; 发起请求,获取响应 通过http库,对目标点进行请求。等同于自己打开浏览器,输入地址 常用库:urllib、urllib3、requests 服务器会返回请求的内容,一般是:HTML、二进制文件(视频、音频)、文档、json字符串等 解析内容 寻找自己需要的信息、就是利用正则表达式或者其他工具库提取目标信息 常用库:re、beauti
相关文章
相关标签/搜索