Hi,你们好,很荣幸有这个机会能够经过写博文的方式,把这些年在后端开发过程当中总结沉淀下来的经验和设计思路分享出来html
根据业务场景,将业务抽离成独立模块,对外经过接口提供服务,减小系统复杂度和耦合度,实现可复用,易维护,易拓展前端
项目中实践例子:node
Before:python
在返还购APP里有个【个人红包】的功能,用户的红包数据来自多个业务,如:邀请新用户注册领取100元红包,大促活动双倍红包,等各类活动红包,多个活动业务都实现了一套不一样规则的红包领取和红包奖励发放的机制,致使红包不可管理,不能复用,难维护难拓展mysql
After:程序员
红包可后台管理redis
设计概要
Before VS After
产品有时提出的业务需求没有往这方面去考虑,结合场景和将来拓展须要,在需求讨论的时候提出模块化设计方案,并能够协助产品进行设计
在项目开发中常常会遇到些相似的功能,可是不一样的开发人员都各自实现,或者由于不能复用又从新开发一个,致使了相似功能的重复开发,因此咱们须要对可以抽离独立服务的功能进行抽离,达到复用的效果,而且能够不断拓展完善,节约了后续开发成本,提升开发效率,易于维护和拓展sql
项目中实践例子:数据库
Before express
在业务中常常须要对用户进行信息通知,如:短信定时通知,APP消息推送,微信通知,等
开发人员在接到需求中有通知功能的时候没有考虑后续拓展,就接入第三方信息通知平台,而后简单封装个信息通知方法,后续也有相似信息通知需求的时候,另外一个开发人员发现当前这个通知方法没法知足本身的需求,而后又本身去了解第三方平台从新封装了通知方法,或者后续需求加了定时通知的功能,开发人员针对业务去实现了个定时通知功能,可是只能本身业务上使用,其余业务没法接入,没有人去作这块功能的抽离,长此以往就演变成功能重复开发,且不易于维护和拓展
After
接触到这种能够抽离通用服务需求的时候,就会与产品确认这种需求是否后续会存在相似的须要,而后建议这把块需求抽离成通用服务,方便后续维护和拓展
设计概要
Before VS After
项目开发过程当中有些需求是与所在项目业务无关,如:收集用户行为习惯,收集商品曝光点击,数据收集提供给BI进行统计报表输出,公用拉新促活业务(柚子街和返还公用),相似这种需求,咱们结合应用场景,考虑服务的独立性,以及将来的拓展须要,架构独立项目进行维护,在服务器上独立分布式部署不影响现有主业务服务器资源
项目中实践例子:
架构用户行为跟踪独立服务,在开发前预估了下这个服务的请求量,并会有相对大量的并发请求
架构方案:
项目搭建选择用nodejs来作服务端
数据异步入库
用户行为跟踪服务的服务架构图
高并发除了须要对服务器进行垂直扩展和水平扩展以外,做为后端开发能够经过高并发优化,保证业务在高并发的时候可以稳定的运行,避免业务停滞带来的损失,给用户带来很差的体验
服务端缓存
内存数据库
* redis * memcache
方式
* 优先缓存 * 穿透DB问题 * 只读缓存 * 更新/失效删除
注意
* 内存数据库的分配的内存容量有限,合理规划使用,滥用最终会致使内存空间不足 * 缓存数据须要设置过时时间,无效/不使用的数据自动过时 * 压缩数据缓存数据,不使用字段不添加到缓存中 * 根据业务拆分布式部署缓存服务器
客户端缓存
方式
* 客户端请求数据接口,缓存数据和数据版本号,而且每次请求带上缓存的数据版本号 * 服务端根据上报的数据版本号与数据当前版本号对比 * 版本号同样不返回数据列表,版本号不同返回最新数据和最新版本号
场景:
* 更新频率不高的数据
服务端缓存架构图
异步编程
方式:
场景:
业务异步处理
方式
场景:
大促活动整点抢限量红包
注意:
缺陷:
【业务异步处理】架构图
【业务异步处理】除了能够在高并发业务中使用,在上面通用服务的设计里也是用这种架构方式
在类秒杀的活动中经过限制请求量,能够避免超卖,超领等问题
高并发的活动业务,经过前端控流,分散请求,减小并发量
服务端限流
客户端控流
当服务器资源消耗已经达到必定的级别的时候,为了保证核心业务正常运行,须要丢卒保车,弃车保帅,服务降级是最后的手段,避免服务器宕机致使业务停滞带来的损失,以及给用户带来很差的体验
业务降级
分流到CDN
中止服务
高并发优化概要图
大多数公司的产品设计和程序猿对于推广活动业务的防刷意识不强,在活动业务设计和开发的过程当中没有把防刷的功能加入业务中,给那些喜欢刷活动的人创造了不少的空子
等到你发现本身被刷的时候,已经产生了不小的损失,少则几百几千,多则几万
随着利益的诱惑,如今已经浮现了一个新的职业“刷客”,专业刷互联网活动为生,养了N台手机+N个手机号码+N个微信帐号,刷到的奖励金进行提现,刷到活动商品进行低价转手处理,开辟了一条新的灰色产业链
咱们要拿起武器(代码)进行自个人防护,风控,加高门槛,经过校验和限制减小风险发生的各类可能性,减小风险发生时形成的损失
这里列出经常使用套路(具体应用结合业务场景):
校验请求合法性
请求头校验
签名校验
验证码/手机短信验证码
业务风控
应对角色
专业刷客
防刷/防羊毛党套路概要图
附加
多操做
当==同用户==屡次触发点击,或者经过模拟并发请求,就会出现多操做的问题,好比:签到功能,一天只能签到一次,能够得到1积分,可是并发的状况下会出现用户能够得到多积分的问题
简化签到逻辑通常是这样的:
查询是否有签到记录 --> 否 --> 添加今日签到记录 --> 累加用户积分 --> 签到成功
查询是否有签到记录 --> 是 --> 今日已经签到过
假设这个时候用户A并发两个签到请求,这时会同时进入到 【查询是否有签到记录】,而后同时返回否,就会添加两条的签到记录,而且多累加积分
最理想简单的方案,只须要在签到记录表添加【签到日期】+【用户ID】的组合惟一索引,当并发的时候只有会一条能够添加成功,其余添加操做会由于惟一约束而失败
库存负数
当==多用户==并发点击参与活动,如:抽奖活动,这个时候奖品只有一个库存了,理论上只有一个用户能够得到,可是并发的时候每每会出现他们都成功得到奖品,致使奖品多支出,加大了活动成本
有问题的逻辑流程通常是这样的:
中奖 --> 查询奖品库存 --> 有 --> 更新奖品库存 --> 添加中奖纪录 --> 告知中奖
中奖 --> 查询奖品库存 --> 无 --> 告知无中奖
假设抽奖活动,当前奖品A只有最后一个库存,而后用户A、B、C,同时参与活动同时中奖奖品都是A,这个时候查询商品库存是存在1个,就会进行更新库存,添加中奖纪录,而后就同时中奖了
最理想根本就不须要用多作一个库存的SELECT奖品库存操做,只须要UPDATE 奖品库存-1 WHERE 奖品库存>=1,UPDATE成功后就说明是有库存的,而后再作后续操做,并发的时候只会有一个用户UPDATE成功
总结:
在开发业务接口的时候须要把==同用户==和==多用户==并发的场景考虑进去,这样就能够避免在并发的时候产生数据异常问题,致使成本多支出
可使用下面的工具进行模拟并发测试:
广泛方案
使用selenium+Headless自动化测试框架
开发
推荐用python开发
优势
无需模拟接口请求
平台接口/页面版本变化,能够快速调整
能够用户操做/选中/点击/模拟登录,等
应用场景:
反反爬虫
在作数据采集的过程当中,有些平台会对重要数据的请求设置反爬虫策略,避免数据被竞品挖掘和利用,以及消耗大量资源拖垮服务器,
反爬虫和反反爬虫是技术之间的较量,这场没有硝烟的战争永不停息。(程序员何须为难程序员)
反爬虫能够分为如下两种
服务端限制
* 服务器端行请求限制,防止爬虫进行数据请求
前端限制
* 前端经过CSS和HTML标签进行干扰混淆关键数据,防止爬虫轻易获取数据
破解服务端限制:
模拟设置请求头
* Referer * User-Agent * Authorization * .....
破解签名
* 签名规则 * 在JS中找到签名规则
控制请求平率
* 调整请求时间,延迟请求
代理IP
* 切换请求的代理IP,自建/第三方
登陆限制
* 带上登陆成功后的Cookie/Authorization
验证码限制
* 识图,基于库/第三方
投毒破解
* 为了防止被投毒,须要对数据进行抽样校验
破解前端限制:
font-face,自定义字体干扰
* 找到ttf字体文件地址,而后下载下来,使用font解析模块包对ttf文件进行解析,与文字编码进行映射出中文
伪元素隐藏式
* 在CSS里找到xxxx::before {content: "中文";}对应的中文
backgroud-image移量
* 经过背景图片的position位置偏移量和图片中的内容进行映射
html标签干扰
* 过滤掉干扰混淆的HTML标签,或者只读取有效数据的HTML标签的内容
做为后端开发者,不只是完成需求功能开发,要结合业务场景进行合理设计,架构将来,对核心业务进行压测优化,以保证业务在并发下可以正常运行,同时要考虑安全问题以及防刷,防羊毛党,在编码上避免坏代码味道,面相抽象开发,适当使用设计模式,避免技术债
开发应该铭记于心的精句: