抓取淘宝商品信息爬虫

时间 2020-02-05

原文原文链接

目标：获取淘宝搜索页面信息，爬取商品的名称和价格html 方法：淘宝的搜索接口python 翻页处理正则表达式库：requestsapp 对比网址：函数起始页第二页 s=44 第三页 s=88 获得第n页是s=（n-1）*44网站淘宝网站的robots协议（通常网站的robots协议约定放在网站的主目录下的/robots.txt中）编码能够看出爬虫不得对