利用Arthas定位线上问题实例
前言
arthas是一个类似于btrace的jvm在线调试分析工具,具体可参考我之前写的一篇博客:利用jvm在线调试工具排查线上问题。本文分享笔者刚遇到的一个问题,虽然不复杂,但是很典型。
问题与分析过程
昨天上线遇到一个问题,交易后给大数据平台异步送数,但是他们说没收到数据,因为我们没有打日志,所以没有直接的证据证明是他们的问题而不是我们的问题。
送数的原理大致如下,就是交易主线程把数据放到队列里,然后异步线程从队列里把数据取出来,发送到后台。
队列: blockingqueue<message> queue = new blockingqueue(); 同步线程: void sendmsg(message msg) { queue.offer(msg); } 异步线程: void consume() { message msg = queue.take(); while(msg != null) { httpclient.post(msg); msg = queue.take(); } }
具体送数的代码如下( 加了行数):
38 public void consume(map msg) { 39 httpclient httpclient = new httpclient(cm); 40 postmethod method = new postmethod(uri); 41 method.addrequestheader("context-type", "application/x-www-form-urlencoded"); 42 jsonobject json = new jsonobject(msg); 43 namevaluepair[] params = new namevaluepair[2]; 44 params[0] = new namevaluepair("topic", topic); 45 params[1] = new namevaluepair("value", json.tojsonstring()); 46 //system.out.println(msg.tostring()); 47 logger.info("bigdatahttp send json:" + json.tojsonstring()); 48 method.addparameters(params); 49 try { 50 51 httpclient.executemethod(method); 52 if(method.getstatuscode() == 200) { 53 logger.info("bigdatahttp response(success):"+ method.getresponsebodyasstring()); 54 } else { 55 logger.info("bigdatahttp response(error):" + method.getresponsebodyasstring()); 56 } 57 } catch(exception e) { 58 logger.error(e.getmessage(), e); 59 } finally { 60 method.releaseconnection(); 61 } 62 }
在日志里没有发现try里的异常,而比较遗憾的是,我们的日志虽然开了info级别,但是因为日志量太大,所以只开了交易上送和下发报文的日志,其他的日志都关了。
现在日志级别没法调,有没有办法能确定,请求返回了200,还是其他值呢?
可以用在线调试工具arthas,我们使用arthas的trace功能,查看这个类执行的详细步骤。
首先连接上这个jvm进程,pid为进程号。
java -jar arthas-boot.jar pid
然后执行命令
trace xxx.util.bigdatautil.bigdatahttpconsumer consume
这条命令的左右就是,追踪xxx.util.bigdatautil.bigdatahttpconsumer类里consume方法的执行过程。
执行的结果如下,每一行最后的是代码行数,我们可以看一下,跟上面代码是一一对应的。
从代码中可以看到,如果返回码是200,那么它会执行第52行,如果返回码不是200,会执行55行,因此,我们通过trace功能确定执行了哪条语句,就可以知道到底返回没返回200,从结果来看,确定返回的不是200。
这样我们就有了确定的证据证明发给后台时返回非200,后台同事检查了自己的配置发现配置有误,是他们自己的问题。
上一篇: 二进制和十进制相互转换、位移运算
下一篇: 高安全性密码的正则表达式验证