只有光头才能变强。
文本已收录至个人GitHub仓库,欢迎Star:https://github.com/ZhongFuCheng3y/3y
记一次在工做中愚蠢的操做,本文关键字:线程安全java
(我怎么每天在写Bug啊)--本文适合新手观看git
我这边有一个系统,提供一个RPC接口去发送各类信息(好比短信、邮件、微信)等等渠道。我这边的系统架构是这样的:github
系统架构
归纳:service系统提供一个RPC接口,别人调用我提供的接口,我在service系统中对这个消息进行判断、拼接等等业务逻辑,最后会将这个消息放到消息队列里边。sender系统会消费消息队列里边的数据,而后发送消息面试
例子:小王调用咱们的RPC接口,想要发送邮件。我对邮件的参数进行判断和拼装成一个我这边定义好的Task,将这个Task丢到消息队列里边。sender系统消费这个Task,调用java.mail的API完成发送邮件的功能。安全
小王调用咱们这个RPC接口,只要service系统把这个task丢到消息队列里边去,咱们就返回response给小王。微信
而小王的这些邮件又十分在乎是否成功发送出去了,若是发送失败了他那边须要重发。因而,他监听咱们DB的binlog,根据binlog的信息来判断是否须要重发。架构
因为种种的缘由,小王但愿调用咱们RPC接口的时候就能拿到一个惟一的标识好让他去判断这封邮件是成功仍是失败并发
流程图异步
上面肯定好需求和思路以后,我这边就去看返回给小王的response对象,一看,发现已经有msgId字段了ide
public class SendResponse { // 错误码 private int errCode; // 错误信息 private String errInfo; // messageId private long msgId; }
我搜了一下这个字段的信息ctrl + shift + f,发现这msgId没有被用到啊。一想,这恰好,我来用了。我看了一下用法,发现这边不是直接使用SendResponse的,而是在外面包了一个枚举类,代码大概以下:
public enum Response { SUCCESS(1, "success"), PARAM_MISSING(2, "param is missing"), INVALID_xxxx(3, "xxxx is invalid"), INVALID_xxxx(4, "xxxx is invalid"), private SendResponse sendResponse; private Response(int errCode, String errInfo) { sendResponse = new SendResponse(); sendResponse.setMsgId(0); sendResponse.setErrCode(errCode); sendResponse.setErrInfo(errInfo); } public SendResponse getSendResponse() { return sendResponse; } }
有了枚举使用起来就很简单了,好比我发现小王某个参数传进来有问题,我反手就是:
Response.PARAM_ERROR
service系统主要作了两件事
// 首先将sendResponse默认设置为success,也就是代码以下: map.put("sendResponse",Response.SUCCESS); // 若是中途某个地方可能有问题了,那咱们将Map中sendResponse进行修改 map.put("sendResponse",Response.ERROR); // 等整条链路完成,从Map拿出sendResponse返回 return map.get("sendResponse");
因而我要作的就是:在将SendResponse返回以前,我生成一个惟一的msgId,并插入到SendResponse对象里边就行了。
Response.getSendResponse().setMsgid(uuid);
在返回sendResponse以前插入msgId就行了
这个需求完成得很是快,简单测试了一下也没毛病,就果断上线了。小王用了一阵子也没说有什么问题,因而这个需求就交付了。
昨天,小王告诉我:“我这边邮件发送失败啦,有msgId,看下是什么缘由形成的“
出问题啦
因而我就去捞线上的日志,发现根据他给出的msgId,我这边打出的日志都不是发送邮件的(而是其余Task的日志)。我这就慌了,难道咱们这个系统出问题了?
继续补充信息
以后发现邮件是发送成功的,可是他拿到部分的msgId是别的Task的,不是邮件的。因而只能先比对剩下的邮件是否有问题,再看看MsgId是什么缘由。
解决首要的问题
现有的条件是:
因而我就去找缘由啦,在查代码的时候发现前同事还在Service系统中的某个类留了一个注解@NotThreadSafe。我就以为确定是中途哪一个地方我没注意到,致使小王拿到了其余Task的msgId。
人肉Debug了一个午休的时间仍是没找出来:每一个线程都独有一份的操做对象,对象的属性都没有逸出(都在方法内部操做),跟着整块链路一直传递,直至链路结束。看似没啥毛病啊,怀疑是否是方向错了。
后来,一想,我应该关注msgId生成以及可能会变更的地方就行了呀。才发现,项目里边用的是枚举啊!
// 首先将sendResponse默认设置为success,也就是代码以下: map.put("sendResponse",Response.SUCCESS); // 若是中途某个地方可能有问题了,那咱们将Map中sendResponse进行修改 map.put("sendResponse",Response.ERROR); // 把response的msgId的值设置为当前Task绑定的值 map.get("sendResponse").setMsgid(uuid); // 等整条链路完成,从Map拿出sendResponse返回 return map.get("sendResponse");
醒悟:
总结:
200多篇原创技术文章海量视频资源精美脑图面试题长按扫码可关注获取