说明:这次采集是采用软件进行,须要付费(此处费用以下图)mysql
第一步:注册登录甩手网sql
http://www.shuaishou.com/products/ToolBox/数据库
帐号:*********工具
密码:********优化
第二步:下载甩手软件spa
第三步:安装甩手工具箱软件,点击最右测“使用”3d
点击当即订购htm
去支付blog
第四步:登录阿里巴巴(1688)平台,查找产品列表页图片
https://s.1688.com/selloffer/offer_search.htm#beginPage=1&offset=0
beginPage为页码
第五步:复制上述地址到甩手软件抓取网址栏,点击抓取整页商品(此处为第1页)
点击下一步:
下载完成后出现下图界面:
点击下一步:
选中导出淘宝助理数据包,点击下一步:
注:此处转换后类目名称可能不成功,能够手动点击选择相应类目再继续下一步
全选,点击属性预转换
点击下一步:
全选点击下一步:
点击导出:
点击打开文件夹:
点击打开淘宝助理5201709031943.csv文件,查看转换效果
删除第一行,并将csv文件另存为xls文件
安装mysql数据库客户端navicat客户端
右击弹出导入对话框
点击下一步:
点击下一步:
点击下一步,导入成功
点击下一步:
此处能够给这个表加一个主键,另外能够将该表修改合适的字段的类型和长度,因为此表比较长,能够考虑优化进行分表存储(此处因为时间关系没有作分表+加主键+修改字段类型和长度的操做)。
点击下一步:
点击下一步后点击开始
说明:此处没有采集彻底,只采集了第1页的商品信息,其余页数据采集同理
此软件也将商品图片采集下来了