利用Arthas定位线上问题实例

前言

Arthas是一个相似于Btrace的JVM在线调试分析工具,具体可参考我以前写的一篇博客:利用JVM在线调试工具排查线上问题。本文分享笔者刚遇到的一个问题,虽然不复杂,可是很典型。java

问题与分析过程

昨天上线遇到一个问题,交易后给大数据平台异步送数,可是他们说没收到数据,由于咱们没有打日志,因此没有直接的证据证实是他们的问题而不是咱们的问题。json

送数的原理大体以下,就是交易主线程把数据放到队列里,而后异步线程从队列里把数据取出来,发送到后台。app

队列:
BlockingQueue<Message> queue = new BlockingQueue();

同步线程:
void sendMsg(Message msg) {
   queue.offer(msg);
}
异步线程:
void consume() {
   Message msg = queue.take();
   while(msg != null) {
       HttpClient.post(msg);
       msg = queue.take();
   }
}

具体送数的代码以下( 加了行数):异步

38  public void consume(Map msg) {
39        HttpClient httpClient = new HttpClient(cm);
40        PostMethod method = new PostMethod(uri);
41        method.addRequestHeader("context-type", "application/x-www-form-urlencoded");
42        JSONObject json = new JSONObject(msg);
43       NameValuePair[] params = new NameValuePair[2];
44       params[0] = new NameValuePair("topic", topic);
45       params[1] = new NameValuePair("value", json.toJSONString());
46       //System.out.println(msg.toString());
47       logger.info("BigDataHttp Send Json:" + json.toJSONString());
48       method.addParameters(params);
49      try {
50
51         httpClient.executeMethod(method);
52         if(method.getStatusCode() == 200) {
53              logger.info("BigDataHttp response(Success):"+ method.getResponseBodyAsString());
54         } else {
55              logger.info("BigDataHttp Response(error):" + method.getResponseBodyAsString());
56         }
57     } catch(Exception e) {
58         logger.error(e.getMessage(), e);
59     } finally {
60         method.releaseConnection();
61     }
62  }

在日志里没有发现try里的异常,而比较遗憾的是,咱们的日志虽然开了info级别,可是由于日志量太大,因此只开了交易上送和下发报文的日志,其余的日志都关了。ide

如今日志级别无法调,有没有办法能肯定,请求返回了200,仍是其余值呢?工具

能够用在线调试工具Arthas,咱们使用Arthas的trace功能,查看这个类执行的详细步骤。post

首先链接上这个JVM进程,pid为进程号。大数据

java -jar arthas-boot.jar pid

而后执行命令url

trace xxx.util.bigDataUtil.BigDataHttpConsumer consume

这条命令的左右就是,追踪xxx.util.bigDataUtil.BigDataHttpConsumer类里consume方法的执行过程。线程

执行的结果以下,每一行最后的是代码行数,咱们能够看一下,跟上面代码是一一对应的。
利用Arthas定位线上问题实例

从代码中能够看到,若是返回码是200,那么它会执行第52行,若是返回码不是200,会执行55行,所以,咱们经过trace功能肯定执行了哪条语句,就能够知道到底返回没返回200,从结果来看,肯定返回的不是200。

这样咱们就有了肯定的证据证实发给后台时返回非200,后台同事检查了本身的配置发现配置有误,是他们本身的问题。

相关文章
相关标签/搜索