Python爬虫学习笔记(一、准备工作)

基本流程 准备工作 通过浏览器查看分析网页,学习编程基础规范。 获取数据 通过HTTP库向目标站点发起请求,请求可以包含额外header等信息,如果服务器能正常响应,会得到一个Response,获取页面内容。 解析内容 得到的内容可能为HTML、json等格式,可以用页面解析库、正则表达式等进行解析。 保存数据 可以保存为文本,也可以保存到数据库。 任务 爬取豆瓣电影Top250的基本信息。 ht
相关文章
相关标签/搜索