摘要商城总结

时间 2019-11-24

标签摘要商城总结繁體版

原文原文链接

第一天：学习电商行业的背景，电商模式：B2B、B2C、B2B2C、O2O。分布式，集群的理解，系统的架构，基于SSO的架构。使用Maven搭建后台工程，及SVN的使用。html

次日： dubbo的学习和使用，系统和系统之间通讯的中间件。 webservice ：系统之间通讯。应用于外部系统，而且数据交换不是特别大的状况下（传统行业OA与ERP之间的通讯）。 http+json：系统之间通讯。属于http的协议，RestFul风格传递数据（手机客户端和后台进行通讯，SSO系统给手机发布接口调用，传递JSON）。 dubbo：系统之间的通讯。属于RPC的协议（底层二进制协议），使用socket通讯，传输效率高，通常用于内部系统之间。做为SOA架构的管理工具，能统计各个服务调用的次数。前端

SSM的整合，逆向工程，商品列表展现，分页插件的使用，Easyui的使用（datagrid的使用查询商品列表）。学习dubbo的架构及4个角色，如何在spring使用。dubbo的使用贯穿于整合项目，有服务层和表现层的交互就须要使用dubbo。java

第三天：商品类目的选择，使用EasyUI的tree控件。传统图片上传功能，上传到某一个tomcat，在集群环境下，上传以后，有可能由另外一台服务器提供服务，图片不存在，因此须要单独创建图片服务器FastDFS（tracker、storage）。在集群环境下使用FastDFS来存储图片（会使用FASTDFS客户端上传下载图片便可）。还有富文本编辑器KindEditor的使用（纯js实现的）。富文本编辑器：引入JS、定义好数据源（textarea）、表单提交以前、同步数据、将富文本编辑器中的内容同步到textarea中。mysql

第四天：商城首页系统（portal）的搭建，使用伪静态URL拦截形式:*.html。（SEO：搜索引擎优化）首页的数据应当动态展现，须要有一个CMS系统来动态维护（CMS：内容管理系统），就是内容和内容分类管理。轮播图的动态展现。首页访问压力很大，须要作缓存redis。linux

第五天：在首页中的访问压力特别大，须要解决高并发的问题，使用缓存技术，学习了redis技术，并使用redis的java客户端Jedis在内容获取时的服务层中添加缓存及缓存同步。 redis：就是一种以KEY-VALUE形式存储数据在内存中的技术（主要用于缓存）。nginx

set get expire incr keys * redis五种存储数据类型：string hash list set sortedset sortedset 用于作排行榜，有序，而且不重复。 redis的持久化方案：RDB、AOF。 RDB：快照。 AOF：(append only file) redis中的每个操做都记录起来。一旦重启，就能够将原来数据恢复。须要手动开启AOF持久化方案，默认是开启RDB。web

redis服务器的搭建及集群搭建（奇数结点）由于：redis集群中有投票机制，半数以上投票。注意：添加缓存的逻辑不能影响正常的业务逻辑。应用最多的数据类型是string和hash。面试

第6、七天： lucene是一个全文检索的工具包，提供不少的检索使用的API。在首页中若是找不到对应的商品，就须要搜索商品，实现搜索的技术是lucene/solr。学习了lucene相关的介绍，应用场景，以及实现全文检索的流程。ajax

索引流程及搜索流程。学习入门程序：索引流程的代码实现。luke的使用。学习入门程序：搜索流程的代码实现。索引域及文档的域，以及Field域的说明（是否分词、是否索引、是否存储）redis

索引的维护：搜索的两种类型（使用query子类及queryParser）及lucene搜索相关的语法。最简单的语法：field:value从field查询包含value的值的数据。

分词的过程：分词（英文单词，按空格分词） --> 过滤（标点符号去掉） --> 大写转小写 --> 去掉停用词。

中文分词器的IKAnalyzer的使用：一、jar包添加到工程build path 二、配置文件（xx.cfg.xml、扩展词典、停用词词典）放入classes下三、定义业务域特色：能够扩展、能够维护、支持中文分词。

第八天： solr 是(基于lucene)搜索引擎，能够独立部署，来实现搜索功能，高亮显示，性能优化，能够解决高并发的搜索需求。 lucene和solr的区别：一、lucene是工具包，solr是服务器（打比方：lucene是汽车引擎，solr是汽车）二、lucene的业务域不须要先定义后使用，solr必须是先定义后使用。三、lucene加入应用系统的时候，耦合度很高不易扩展。四、solr是服务器，只须要经过http请求操做索引。维护、升级方便，而且能作性能优化。使用solrj做为java的客户端操做索引和搜索。京东案例的实现。使用IK分词器，配置在schema.xml中。

第九天： taotao商城的solr服务在linux的搭建，搜索服务层系统的搭建，表现层搭建，并使用solr实现商品搜索功能（中文分析器的配置、业务域定义、入数据到索引库、索功能的实现）。 solr分页：经过solrj设置start，设置rows，默认查询是10条。查询的时候须要指定默认的搜索域。

第十天：在并发量特别大的状况下，一个solr服务器没法知足要求，学习了solr集群在linux下的搭建，参考教案。测试了solrj的集群版的使用，将搜索功能切换到集群版。全局异常处理：须要建立一个类实现全局异常处理器的接口（handlerexceptionresolver），配置在配置文件springmvc。xml中。全局异常处理中实现：一、日志处理二、发送异常信息邮件给相关人员三、响应一个友好的错误页面给客户

第十一天：索引库须要同步时，可使用异步消息的中间件(activemq)来实现索引库的同步。

Activemq的使用场景：不须要同步等待时的系统之间的通讯使用。好比：订单系统。

产生订单后，须要发送响应给客户，提示成功。但不须要等待用户点击肯定后才继续产生订单。订单系统只须要产生订单后，异步发送一个消息，又继续执行下一个产生订单逻辑而不须要再等待页面响应。同步索引库。同步缓存。生成静态页面。

传递消息的类型： PTP --> queue --> 默认缓存在mq服务器上，只能被一个消费者接收。 publish/subscribe --> topic默认是不缓存，能够被多个消费者接收。（须要消费者先订阅）

消息的格式（JMS的规范）6种格式。TxtMessage、ObjectMessage、ByteMessage、…… 一、通常是和spring进行整合使用。二、发送端：JMSTemplate 发送消息。三、接收端：使用设置一个监听容器 --> 指定监听器 (MessageListener)。

第十二天：商品详情的系统搭建（参考京东，访问商品详情时，域名已经变化）。使用jsp和redis实现页面的高性能动态展现。若是高并发量：须要实现网页静态化来提高响应速度。

freemarker可实现网页静态化，使用freemarker的经常使用语法学习。实现网页静态化的方案实现。经过使用activemq实现同步生成静态网页。实现网页静态化的方案：部署不一样的服务器上的（taoao-item-web）工程，分别订阅了topic（当商品添加/更新的时候发送的topic包含商品id），工程接收到消息，产生静态页面。工程所在的服务器上再部署一个http服务器，来指定静态页面的目录，提供浏览器访问静态页面，提高效率。

第十三天：在实现静态化的方案中须要使用nginx，须要学习nginx。nginx能实现的功能：一、配置虚拟主机，复制server结点便可。二、反向代理，设置upstream节点来指定服务的ip地址和端口，在location结点设置proxy_pass=http://upstream; 参考教案。三、负载均衡。四、做为Http服务器。学习实现nginx的高可用的原理。

第十四天： SSO系统：主要解决分布式环境下session共享的问题。 SSO系统的搭建，注册，登陆，经过token（至关于jsessionid）获取用户信息。实现SSO服务，提供给其余客户端（如手机接口）接口。登陆流程：用户填入用户名和密码，若是正确，key是一个uuid生成的惟一值（token）。用户信息存储到redis中，设置此key的有效期模拟session（30分钟），设置到cookie中（跨域：访问的端口不一样，域名不一样）。使用JSONP的技术：登陆以后，在首页须要显示用户信息。使用JSONP来实现ajax跨域。

第十五天： SSO系统的接口的开发完成及购物车实现以及订单确认页面实现。购物车使用cookie来存放。有缺点：更换设备不能同步数据，存储的容量有限，若是cookie一旦被禁用，没法使用。解决方案：在用户未登陆的状况下，继续使用cookie来存放购物车，展现列表以cookie为准。一旦用户登陆，将cookie的数据同步到数据库redis中，并删除cookie的内容，展现购物车列表就以redis中的数据为准，后续的添加到购物车也须要添加到redis中。进入订单确认页面，须要认证身份，经过拦截器来实现。

第十六天：订单提交的功能实现。项目的部署，mysql的linux的安装，系统的网络拓扑图，服务器的域名规划，服务器的数量规划及部署。使用tomcat的热部署，反向代理的配置。

回到顶部项目中的问题 PS：如下描述若与就业老师所说有冲突，请以就业老师为准，另外参考简历必定要改，切不可拿来主义

一、淘淘商城简历中的描述参考简历。注意：在真实的开发项目中，开发工程师不可能开发全部的模块，只会负责某几个模块，你们所要描述的是：你所负责的模块（通常3到4个模块）。

二、淘淘网站的并发量大概：说5000左右也行。（此处要问怎么来的，能够说通过压力测试出来的，本身没作过，可是知道。有些状况下，并非全部的事情都是由你来作，由面试官决定用不用你，你把所知道的说清楚就行）能够知足目前的业务需求。因为咱们的系统是分布式架构，支持水平扩展，若是未来并发量提升的话，能够增长服务器来提升并发量。

三、淘淘商城人员的配置产品经理：3人，肯定需求及给出产品原型图。项目经理：1人，项目管理。前端团队：5人，根据产品经理给出原型制做出静态页面（固然也包括UI）。后端团端：20人，实现产品的功能（大家就属于后端团队）。测试团队：5人，负责测试产品的全部的功能。

四、开发周期如今开发采用敏捷开发，快速迭代，开发周期大概6-8个月，后期通常采用迭代的方式开发，通常迭代的周期为一个月左右。（迭代就是所谓的一个小版本的开发）

五、SKU 表示惟一肯定惟一的商品的单位（最小库存单位）SKU==商品ID 例如：对于京东的一款商品：一种颜色，一种配置，一种配送方式，就惟一肯定一个商品，这种就叫作一个SKU。相似于下图：

六、你说你用了redis，大家redis存的是什么格式的数据，都是怎么存的？ redis中存放数据都是key-value的形式。咱们商城使用string类型来存放的。拿商品来讲：商品的id就是key，商品相关的商品信息组成一个JSON存放。

七、你前台系统portal采用4服务器作集群部署，前台系统的并发量提高上去，那对于数据库会不会形成一个瓶颈，这一块大家是怎么处理的？ portal在高并发的状况下，能够经过部署集群来提升并发量，这种时候，若是每次都访问数据，确实会对数据库形成很大的压力，那么这时候，咱们就采用在服务层增长缓存，使用redis实现，这样客户端请求到达时，先从缓存中读取，若是存在数据则直接返回，而不会再从数据库查询，若是缓存中没有，则从数据库查询，这样就可减小数据库的访问，达到提高数据的访问瓶颈。

八、购物车存在cookie中，能够实现不登陆就可使用购物车，若是我没有登陆，购买了商品，如今更换了设备（电脑），那还能不能看到我买的商品？若是看不到怎么作cookie同步？不能；现阶段，淘淘商城是采用cookie的方式存放购物车，以减小服务端的存储压力。可是弊端就是当更换设备后将看不到已添加的商品，也就是不能同步商品信息。打算下一步这么实现：当用户没有登陆时，商品的数据放入购物车中，将存放于cookie中，此时若是用户登陆，将cookie中的数据存放在redis中，而且是和用户的ID关联，并将cookie中的数据删除。此时若是用户更换设备，只要使用同一账号登陆，就能够看到购物车中的商品信息，就达到了同步cookie的目的。

九、大家商城是经过什么来作搜索的？由于系统要使用站内搜索功能，数据量很大，须要使用solr。 solr是(基于lucene)搜索引擎，能够独立部署，来实现搜索功能、高亮显示、性能优化，能够解决高并发的搜索需求。例如：咱们系统就是用solr作商品搜索。--> 怎么作的呢？ solr是一个服务器，须要搭建，须要先定义好Field和FieldType，定义中文分词器，再使用。经过solr的Java客户端solrj链接solr服务，它提供丰富的操做索引的方法，能够经过这个客户端来实现搜索功能。大家索引库通常有多少数据？答：几百万若是数据量特别大？怎么办？答：作集群。索引库是如何同步？答：activemq异步消息队列。

十、solr和lucene他们之间有什么区别？ lucene是一个工具包，相似于一个类库。 solr是一个基于solr的搜索引擎，能够独立运行和部署，它能够经过http请求来索引和搜索。打个比方：solr就至关于一辆汽车，而lucene只是汽车中的引擎，你能够开车，但不开引擎。另外，使用solr能够独立部署，扩展容易，因此能够最大程度的解耦，而lucene使用须要在业务逻辑中添加代码，逻辑耦合度很高，不易维护。

十一、大家使用activemq应用在哪一种业务场景中，既然都是系统通讯，和其余的系统通讯有什么区别？咱们使用activemq应用在生成商品详情，同步索引库。activemq是一个消息中间件，异步发送消息，而其余通讯技术：好比dubbo，是同步等待。好比：使用activemq在商品服务模块，添加商品并不须要等待索引库同步完成后才能继续添加下一个商品，只须要异步发送一个消息告诉索引服务，索引服务经过商品ID查询商品更新索引。再有：面试中，要淡定，若是有面试官问：数据库设计这样作正确吗？你不清楚的状况下，你就说咱们公司就是这么解决的。其余的我不知道。有些面试官，可能他也不知道，他也想知道。

十二、电商活动倒计时方案一、肯定一个基准时间。可使用一个sql语句从数据库中取出一个当前时间。SELECT NOW() 二、活动开始的时间是固定的。三、使用活动开始时间减去基准时间能够计算出一个秒为单位的数值。四、在redis中设置一个key（活动开始标识）。设置key的过时时间为第三步计算出来的时间。五、展现页面的时候取出key的有效时间。ttl命令。使用js倒计时。六、一旦活动开始的key失效，说明活动开始。七、须要在活动的逻辑中，先判断活动是否开始。

1三、大家的商城的秒杀方案是什么？一、将商品的数量放入redis中。二、秒杀时，可使用decr命令将商品的数量减一。若是不是负数说明抢到。三、若是返回的是负数，说明商品已经抢完。

1四、dubbo服务使用流程，运行流程？zookeeper注册中心的做用？使用流程：第一步：要在系统中使用dubbo应该先搭建一个注册中心，通常推荐使用zookeeper。第二步：有了注册中心而后是发布服务，发布服务须要使用spring容器和dubbo标签来发布服务。而且发布服务时须要指定注册中心的位置。第三步：服务发布以后就是调用服务。通常调用服务也是使用spring容器和dubbo标签来引用服务，这样就能够在客户端的容器中生成一个服务的代理对象，在action或者Controller中直接调用service的方法便可。 Zookeeper注册中心的做用：主要就是注册和发现服务的做用。相似于房产中介的做用，在系统中并不参与服务的调用及数据的传输。

1五、redis为何能够作缓存？项目中使用redis的目的是什么？redis何时使用？一、Redis是key-value形式的nosql数据库。能够快速的定位到所查找的key，并把其中的value取出来。而且redis的全部的数据都是放到内存中，存取的速度很是快，通常都是用来作缓存使用。二、项目中使用redis通常都是做为缓存来使用的，缓存的目的就是为了减轻数据库的压力提升存取的效率。三、在互联网项目中只要是涉及高并发或者是存在大量读数据的状况下均可以使用redis做为缓存。固然redis提供丰富的数据类型，除了缓存还能够根据实际的业务场景来决定redis的做用。例如使用redis保存用户的购物车信息、生成订单号、访问量计数器、任务队列、排行榜等。

1六、AcitveMQ的做用、原理？（生产者。消费者。 p2p、订阅实现流程） Activemq的做用就是系统之间进行通讯。固然可使用其余方式进行系统间通讯，若是使用Activemq的话能够对系统之间的调用进行解耦，实现系统间的异步通讯。原理就是生产者生产消息，把消息发送给activemq。Activemq接收到消息，而后查看有多少个消费者，而后把消息转发给消费者，此过程当中生产者无需参与。消费者接收到消息后作相应的处理和生产者没有任何关系。

1七、ActiveMQ在项目中如何应用的？ Activemq在项目中主要是完成系统之间通讯，而且将系统之间的调用进行解耦。例如在添加、修改商品信息后，须要将商品信息同步到索引库、同步缓存中的数据以及生成静态页面一系列操做。在此场景下就可使用activemq。一旦后台对商品信息进行修改后，就向activemq发送一条消息，而后经过activemq将消息发送给消息的消费端，消费端接收到消息能够进行相应的业务处理。

1八、ActiveMQ若是数据提交不成功怎么办？ Activemq有两种通讯方式，点到点模式和发布订阅模式。若是是点到点模式的话，若是消息发送不成功此消息默认会保存到activemq服务端直到有消费者将其消费，因此此时消息是不会丢失的。若是是发布订阅模式的通讯方式，默认状况下只通知一次，若是接收不到此消息就没有了。这种场景只适用于对消息送达率要求不高的状况。若是要求消息必须送达不能够丢失的话，须要配置持久订阅。每一个订阅端定义一个id，在订阅时向activemq注册。发布消息和接收消息时须要配置发送模式为持久化。此时若是客户端接收不到消息，消息会持久化到服务端，直到客户端正常接收后为止。

1九、当被问到某个模快存在安全性问题（sso单点登陆系统）时，如何回答？目前商城的sso系统的解决方案中直接把token保存到cookie中，确实存在安全性问题。可是实现简单方便。若是想提升安全性可使用CAS框架实现单点登陆。参考连接：

20、当技术面试官问到你某个技术点更深层次研究时，本身没有深刻了解怎么回答？若是没有深刻研究就直接回答不知道就能够了。

2一、如何把热点商品或者是推广商品的排名提升？能够设置文档中域的boost值，boost值越高计算出来的相关度得分就越高，排名也就越靠前。

2二、solr的原理 Solr是基于Lucene开发的全文检索服务器，而Lucene就是一套实现了全文检索的api，其本质就是一个全文检索的过程。全文检索就是把原始文档根据必定的规则拆分红若干个关键词，而后根据关键词建立索引，当查询时先查询索引找到对应的关键词，并根据关键词找到对应的文档，也就是查询结果，最终把查询结果展现给用户的过程。

2三、solr里面IK分词器的原理 IK分析器的分词原理本质上是词典分词。如今内存中初始化一个词典，而后在分词过程当中逐个读取字符，和字典中的字符相匹配，把文档中的全部的词语拆分出来的过程。

2一、支付接口是怎么作的？面试中能够说支付这部分不是咱们作的，咱们项目中并无涉及支付部分的处理。若是想了解支付是如何实现能够参考以前学过的易宝支付相关处理以及支付宝、微信支付相关文档。

2四、业务如何说？先说业务、说表、说具体实现？先说整体的业务流程，而后再说具体业务的实现方法及使用的技术。最后说你在系统中负责的内容。不须要说表结构。

2五、单点登陆系统，若是cookie禁用，大家怎么解决？若是禁用cookie可使用url中带参数，把token传递给服务端。固然此方法涉及安全性问题，其实在cookie中保存token一样存在安全性问题。推荐使用SSO框架CAS实现单点登陆。

2六、大家作移动端没有，若是没有移动端，大家为何作单点登陆？单点登陆并非为移动端准备的，移动端有本身的登陆方式。单点登陆是解决在同一个公司内部多个互信网站之间进行跳转时不须要屡次登陆，多个系通通一登陆入口。

2七、单点登陆的核心是什么？单点登陆的核心是如何在多个系统之间共享身份信息（即共享session）。

2八、除了单点登录，还作过什么登录的方式？除了单点登陆那就是普通登陆方式，用户在同一个公司的多个系统之间跳转时须要屡次登陆。

2九、单点登陆，http无状态的，别人模仿如何在后端处理？ http是无状态的，若是别人模仿浏览器发送http请求，通常后台是没法识别的。若是对安全要求高的状况下应该是https协议。能够保证在通讯过程当中没法窃取通讯内容。

30、安全性问题（别的网站使用爬虫技术爬你的网站怎么办？有没有安全措施）单位时间内请求次数超过某个阈值就让输入验证码，能够极大下降抓取的速度，若是屡次超过某个阀值能够加入黑名单。还有就是页面内容使用json返回，数据常常变一变格式，或者js动态生成页面内容。

3一、商品存入数据库怎么保证数据库数据安全？一、对用户安全管理用户操做数据库时，必须经过数据库访问的身份认证。删除数据库中的默认用户，使用自定义的用户及高强度密码。二、定义视图为不一样的用户定义不一样的视图，能够限制用户的访问范围。经过视图机制把须要保密的数据对无权存取这些数据的用户隐藏起来，能够对数据库提供必定程度的安全保护。实际应用中常将视图机制与受权机制结合起来使用，首先用视图机制屏蔽一部分保密数据，而后在视图上进一步进行受权。三、数据加密数据加密是保护数据在存储和传递过程当中不被窃取或修改的有效手段。四、数据库按期备份五、审计追踪机制审计追踪机制是指系统设置相应的日志记录，特别是对数据更新、删除、修改的记录，以便往后查证。日志记录的内容能够包括操做人员的名称、使用的密码、用户的IP地址、登陆时间、操做内容等。若发现系统的数据遭到破坏，能够根据日志记录追究责任，或者从日志记录中判断密码是否被盗，以便修改密码，从新分配权限，确保系统的安全。

3二、订单表的数据量太大，我把订单分到许多表中，那么我我想用一条sql查处全部的订单，怎么解决？分库状况下：可使用mycat数据库中间件实现多个表的统一管理。虽然物理上是把一个表中的数据保存到多个数据库中，可是逻辑上仍是一个表，使用一条sql语句就能够把数据所有查询出来。单库状况下：须要动态生成sql语句。先查询订单相关的表，而后将查询多个表的sql语句使用union链接便可。

3三、我们单点登陆模块中，别人伪造咱们cookie中的token怎么办？服务端是没法阻止客户端伪造cookie的，若是对安全性要求高的话能够可以使用CAS框架。

3四、第一个是当两个客户同时买一件商品时库存只有一个了，怎么控制？可使用mysql的行锁机制，实现乐观锁，在更新商品以前将商品锁定，其余用户没法读取，当此用户操做完毕后释放锁。当并发量高的状况下，须要使用缓存工具例如redis来管理库存。

3五、对数据库只是采用了读写分离，并无彻底解决数据库的压力，那么有什么办法解决？若是数据库压力确实很大的状况下能够考虑数据库分片，就是将数据库中表拆分到不一样的数据库中保存。可使用mycat中间件。

3六、同一帐号以客户端登陆怎么挤掉另外一端。用户登陆后须要在session中保存用户的id。当用户登陆时，从当前全部的session中判断是否有此用户id的存在，若是存在的话就把保存此用户id的session销毁。

3七、solr的索引查询为何比数据库要快？ Solr使用的是Lucene API实现的全文检索。全文检索本质上是查询的索引。而数据库中并非全部的字段都创建的索引，更况且若是使用like查询时很大的多是不使用索引，因此使用solr查询时要比查数据库快。

3八、solr索引库个别数据索引丢失怎么办？首先Solr是不会丢失个别数据的。若是索引库中缺乏数据，那就向索引库中添加。

3九、Lucene索引优化直接使用Lucene实现全文检索已是过期的方案，推荐使用solr。Solr已经提供了完整的全文检索解决方案。