【爬虫】【原创】08 使用简单正则表达式爬取下厨房(早餐,午餐,晚餐)

  目的 1)      提取下厨房关键词为(早餐,午餐,晚餐)的菜谱 2)      获取“菜谱链接,图片地址,菜名,材料,七天内多少人做过,作者“,存储到MONGODB 3)      对每个菜谱进行网页截图,保存到本地 2.      目标站点分析 网址: http://www.xiachufang.com/ 输入关键词“早餐”,发现是跳转链接(暂时没想到这种怎么处理比较好,就单独拿出来处理
相关文章
相关标签/搜索