Python爬虫学习笔记（一、准备工作）

时间 2020-12-30

原文原文链接

基本流程准备工作通过浏览器查看分析网页，学习编程基础规范。获取数据通过HTTP库向目标站点发起请求，请求可以包含额外header等信息，如果服务器能正常响应，会得到一个Response，获取页面内容。解析内容得到的内容可能为HTML、json等格式，可以用页面解析库、正则表达式等进行解析。保存数据可以保存为文本，也可以保存到数据库。任务爬取豆瓣电影Top250的基本信息。 ht

>>阅读原文<<