絮叨两句:
博主是一名软件工程系的在校生,利用博客记录本身所学的知识,也但愿能帮助到正在学习的同窗们
人的一辈子中会遇到各类各样的困难和折磨,逃避是解决不了问题的,惟有以乐观的精神去迎接生活的挑战
少年易老学难成,一寸光阴不可轻。
最喜欢的一句话:今日事,今日毕
html
从Python爬虫到Spark预处理数据的真实需求[一]
从Python爬虫到Spark预处理数据的真实需求[二]
从Python爬虫到Spark预处理数据的真实需求[三]
从Python爬虫到Spark预处理数据的真实需求[四]
从Python爬虫到Spark预处理数据的真实需求[五]mysql
这一章主要是阐述一下需求以及所要用到的技术web
提示:如下是本篇文章正文内容,下面案例可供参考sql
如图:
数据库
CREATE TABLE `xxuan_car_jd_ycj_product` ( `id` int(11) NOT NULL AUTO_INCREMENT, `skuid` varchar(100) DEFAULT NULL COMMENT '商品ID\n', `name` varchar(100) DEFAULT NULL COMMENT '商品名称', `brand` varchar(100) DEFAULT NULL COMMENT '商品品牌\n', `freezing` varchar(100) DEFAULT NULL COMMENT '冰点', `url` varchar(100) DEFAULT NULL COMMENT '商品连接\n', `originplace` varchar(100) DEFAULT NULL COMMENT '商品产地', `netweight` varchar(100) DEFAULT NULL COMMENT '毛重', `price` varchar(100) DEFAULT NULL COMMENT '商品价格\n', `commodity_Name` varchar(100) DEFAULT NULL COMMENT '商品标题名称', `image` varchar(100) DEFAULT NULL COMMENT '商品图片\n', `category` varchar(100) DEFAULT NULL COMMENT '产品类别', `package` varchar(100) DEFAULT NULL COMMENT '包装规格', `boiling` varchar(100) DEFAULT NULL COMMENT '干湿沸点', `sales` varchar(100) DEFAULT NULL COMMENT '销售规格', `installation` varchar(100) DEFAULT NULL COMMENT '安装位置', `transmission` varchar(100) DEFAULT NULL COMMENT '变速箱类型', PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=1025 DEFAULT CHARSET=utf8; CREATE TABLE `xxuan_car_jd_tjj_product` ( `id` int(11) NOT NULL AUTO_INCREMENT, `skuid` varchar(100) DEFAULT NULL COMMENT '商品ID\n', `name` varchar(100) DEFAULT NULL COMMENT '商品名称', `brand` varchar(100) DEFAULT NULL COMMENT '商品品牌', `price` varchar(100) DEFAULT NULL COMMENT '商品价格', `url` varchar(100) DEFAULT NULL COMMENT '商品连接', `commodity_Name` varchar(100) DEFAULT NULL COMMENT '商品标题名称', `image` varchar(100) DEFAULT NULL COMMENT '商品图片\n', `Additivetype` varchar(100) DEFAULT NULL COMMENT '添加剂类型', `TypesOfAdditives` varchar(100) DEFAULT NULL COMMENT '添加剂种类', `NetContent` varchar(100) DEFAULT NULL COMMENT '净含量', `ArticleNumber` varchar(100) DEFAULT NULL COMMENT '货号', `GrossWeight` varchar(100) DEFAULT NULL COMMENT '商品毛重', `CommodityOrigin` varchar(100) DEFAULT NULL COMMENT '商品产地', PRIMARY KEY (`id`) USING BTREE ) ENGINE=InnoDB AUTO_INCREMENT=20959 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT; CREATE TABLE `xxuan_car_jd_scp_product` ( `id` int(11) NOT NULL AUTO_INCREMENT, `skuid` varchar(100) DEFAULT NULL COMMENT '商品id', `name` varchar(100) DEFAULT NULL COMMENT '商品名称', `brand` varchar(100) DEFAULT NULL COMMENT '商品品牌\n', `price` varchar(100) DEFAULT NULL COMMENT '商品价格', `url` varchar(1000) DEFAULT NULL COMMENT '商品连接', `commodity_Name` varchar(100) DEFAULT NULL COMMENT '商品标题名称', `image` varchar(100) DEFAULT NULL COMMENT '商品图片\n', `ArticleNumber` varchar(100) DEFAULT NULL COMMENT '货号', `boiling` varchar(100) DEFAULT NULL COMMENT '干湿沸点', `package` varchar(100) DEFAULT NULL COMMENT '包装规格', `GrossWeight` varchar(100) DEFAULT NULL COMMENT '商品毛重', `CommodityOrigin` varchar(100) DEFAULT NULL COMMENT 'CommodityOrigin', `process` varchar(100) DEFAULT NULL COMMENT '产品工艺', `Installation` varchar(100) DEFAULT NULL COMMENT '安装位置', `type` varchar(100) DEFAULT NULL COMMENT '类别', `texture` varchar(100) DEFAULT NULL COMMENT '材质', PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=3288 DEFAULT CHARSET=utf8; CREATE TABLE `xxuan_car_jd_mobil_product` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '商品ID\n', `skuid` varchar(100) NOT NULL COMMENT '商品ID', `name` varchar(100) DEFAULT NULL COMMENT '机油名称', `brand` varchar(100) DEFAULT NULL COMMENT '机油品牌\n', `price` varchar(100) NOT NULL COMMENT '商品价格', `type` varchar(200) DEFAULT NULL COMMENT '机油种类', `url` varchar(100) NOT NULL COMMENT '商品连接', `originplace` varchar(200) DEFAULT NULL COMMENT '机油产地', `netweight` varchar(200) DEFAULT NULL COMMENT '毛重', `commodity_Name` varchar(200) DEFAULT NULL COMMENT '商品标题名称', `image` varchar(200) DEFAULT NULL COMMENT '图片地址', `viscosity` varchar(200) DEFAULT NULL COMMENT '粘度', `volume` varchar(200) DEFAULT NULL COMMENT '容量', PRIMARY KEY (`id`) USING BTREE ) ENGINE=InnoDB AUTO_INCREMENT=69871 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT; CREATE TABLE `xxuan_car_jd_lt_product` ( `id` int(11) NOT NULL AUTO_INCREMENT, `skuid` varchar(100) DEFAULT NULL, `name` varchar(100) DEFAULT NULL, `brand` varchar(100) DEFAULT NULL, `url` varchar(100) DEFAULT NULL, `price` varchar(100) DEFAULT NULL, `commodity_Name` varchar(100) DEFAULT NULL, `image` varchar(100) DEFAULT NULL, `netweight` varchar(100) DEFAULT NULL, `originplace` varchar(100) DEFAULT NULL, `size` varchar(100) DEFAULT NULL, `width` varchar(100) DEFAULT NULL, `number` varchar(100) DEFAULT NULL, `performance` varchar(100) DEFAULT NULL, `Flattening` varchar(100) DEFAULT NULL, `characteristics` varchar(100) DEFAULT NULL, `type` varchar(100) DEFAULT NULL, PRIMARY KEY (`id`) USING BTREE ) ENGINE=InnoDB AUTO_INCREMENT=154715 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT; //HK 这两张表用来存储请求不成功的url 到最后能够本身在进行请求 CREATE TABLE `xxuan_car_jd_hk_mobil_product` ( `href` varchar(100) DEFAULT NULL, `branName` varchar(100) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT; CREATE TABLE `xxuan_car_jd_lt_hk_product` ( `href` varchar(100) DEFAULT NULL, `name` varchar(100) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT; CREATE TABLE `xxuan_car_jd_hhs_product` ( `id` int(11) NOT NULL AUTO_INCREMENT, `skuid` varchar(1000) DEFAULT NULL COMMENT '商品ID', `name` varchar(1000) DEFAULT NULL COMMENT '商品名称\n', `brand` varchar(1000) DEFAULT NULL COMMENT '商品品牌\n', `price` varchar(1000) DEFAULT NULL COMMENT '商品价格', `url` varchar(1000) DEFAULT NULL COMMENT '商品连接', `commodity_Name` varchar(1000) DEFAULT NULL COMMENT '商品标题名称', `image` varchar(1000) DEFAULT NULL COMMENT '商品图片\n', `sales` varchar(1000) DEFAULT NULL COMMENT '销售规格', `material` varchar(1000) DEFAULT NULL COMMENT '产品材质', `type` varchar(1000) DEFAULT NULL COMMENT '产品类型', `ArticleNumbera` varchar(1000) DEFAULT NULL COMMENT '货号', `GrossWeight` varchar(1000) DEFAULT NULL COMMENT 'GrossWeight', PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=5668 DEFAULT CHARSET=utf8;