数据采集流程--采集阿里巴巴商品信息--使用甩手工具箱进行采集

 说明:这次采集是采用软件进行,须要付费(此处费用以下图)mysql

第一步:注册登录甩手网sql

http://www.shuaishou.com/products/ToolBox/数据库

帐号:*********工具

密码:********优化

第二步:下载甩手软件spa

第三步:安装甩手工具箱软件,点击最右测“使用”3d

点击当即订购htm

去支付blog

第四步:登录阿里巴巴(1688)平台,查找产品列表页图片

http://page.1688.com/

https://s.1688.com/selloffer/offer_search.htm#beginPage=1&offset=0

beginPage为页码

 

第五步:复制上述地址到甩手软件抓取网址栏,点击抓取整页商品(此处为第1页)

点击下一步:

下载完成后出现下图界面:

点击下一步:

选中导出淘宝助理数据包,点击下一步:

注:此处转换后类目名称可能不成功,能够手动点击选择相应类目再继续下一步

全选,点击属性预转换

点击下一步:

 

全选点击下一步:

点击导出:

点击打开文件夹:

点击打开淘宝助理5201709031943.csv文件,查看转换效果

删除第一行,并将csv文件另存为xls文件

安装mysql数据库客户端navicat客户端

右击弹出导入对话框

点击下一步:

点击下一步:

点击下一步,导入成功

点击下一步:

此处能够给这个表加一个主键,另外能够将该表修改合适的字段的类型和长度,因为此表比较长,能够考虑优化进行分表存储(此处因为时间关系没有作分表+加主键+修改字段类型和长度的操做)。

 

点击下一步:

点击下一步后点击开始

说明:此处没有采集彻底,只采集了第1页的商品信息,其余页数据采集同理

      此软件也将商品图片采集下来了

相关文章
相关标签/搜索