淘宝天猫商品库存抓取分析

昨天收到公众号粉丝的爬虫需求:css

抓取平台:天猫或者淘宝
爬取对象:某个商品的各分类的价格和库存数

所以花费两天时间抓取完成,基于python3 抓取, flask 可视化页面查看,目前支持网页可视化查看:html

用途

实时监控竞品销量:python

使用方式

下载代码

首先在个人 github 上面下载该项目的代码,项目地址为:git

tbtmStoregithub

代码的结构路径为:flask

---static
---bootstrap.min.css
---templates
---htmlWeb.pybootstrap

运行代码

在当前目录下运行代码浏览器

python3 htmlWeb.py

在浏览器里面打开网址:127.0.0.1:5000 显示以下页面:url

只要在输入框输入商品的 id 便可code

id 的来源为搜索淘宝的商品关键词后,点击进入详情页,能够在 url 中看到所须要的商品的 id 。例如搜索关键词 女装,点击其中一个进入页面:

新页面的 url 中的 id 即为商品惟一的 id

url 中的 id=586378509246

https://item.taobao.com/item.htm?id=586378509246&ali_refid=a3_430673_1006:1123737596:N:emtiAWsF8%2Bzhhxaiwzc0Aw%3D%3D:a9425d62eed7f452bd2b9a40bf378589&ali_trackid=1_a9425d62eed7f452bd2b9a40bf378589&spm=a2e15.8261149.07626516002.22

其余相关

若是须要基于关键字搜索商品价格等,能够查看以下项目:

tbtmGoods

爬虫代码不知道怎么写
关注公众号让做者帮你解决

相关文章
相关标签/搜索