欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

java命令--jstack 工具 查看JVM堆栈信息

程序员文章站 2022-03-05 12:02:41
一、介绍 jstack是java虚拟机自带的一种堆栈跟踪工具。jstack用于打印出给定的java进程ID或core file或远程调试服务的Java堆栈信息,如果是在64位机器上,需要指定选项"-J-d64",Windows的jstack使用方式只支持以下的这种方式: 主要分为两个功能: a. 针 ......

一、介绍

jstack是java虚拟机自带的一种堆栈跟踪工具。jstack用于打印出给定的java进程id或core file或远程调试服务的java堆栈信息,如果是在64位机器上,需要指定选项"-j-d64",windows的jstack使用方式只支持以下的这种方式:

jstack [-l] pid

 

主要分为两个功能: 

a.  针对活着的进程做本地的或远程的线程dump; 

b.  针对core文件做线程dump。

jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。 线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。

 

so,jstack命令主要用来查看java线程的调用堆栈的,可以用来分析线程问题(如死锁)。

线程状态

想要通过jstack命令来分析线程的情况的话,首先要知道线程都有哪些状态,下面这些状态是我们使用jstack命令查看线程堆栈信息时可能会看到的线程的几种状态:

new,未启动的。不会出现在dump中。

runnable,在虚拟机内执行的。运行中状态,可能里面还能看到locked字样,表明它获得了某把锁。

blocked,受阻塞并等待监视器锁。被某个锁(synchronizers)給block住了。

wating,无限期等待另一个线程执行特定操作。等待某个condition或monitor发生,一般停留在park(), wait(), sleep(),join() 等语句里。

timed_wating,有时限的等待另一个线程的特定操作。和waiting的区别是wait() 等语句加上了时间限制 wait(timeout)。

terminated,已退出的。

monitor

在多线程的 java程序中,实现线程之间的同步,就要说说 monitor。 monitor是 java中用以实现线程之间的互斥与协作的主要手段,它可以看成是对象或者 class的锁。每一个对象都有,也仅有一个 monitor。下 面这个图,描述了线程和 monitor之间关系,以 及线程的状态转换图:

进入区(entrt set):表示线程通过synchronized要求获取对象的锁。如果对象未被锁住,则迚入拥有者;否则则在进入区等待。一旦对象锁被其他线程释放,立即参与竞争。

拥有者(the owner):表示某一线程成功竞争到对象锁。

等待区(wait set):表示线程通过对象的wait方法,释放对象的锁,并在等待区等待被唤醒。

从图中可以看出,一个 monitor在某个时刻,只能被一个线程拥有,该线程就是 “active thread”,而其它线程都是 “waiting thread”,分别在两个队列 “ entry set”和 “wait set”里面等候。在 “entry set”中等待的线程状态是 “waiting for monitor entry”,而在“wait set”中等待的线程状态是 “in object.wait()”。 先看 “entry set”里面的线程。我们称被 synchronized保护起来的代码段为临界区。当一个线程申请进入临界区时,它就进入了 “entry set”队列。对应的 code就像:

synchronized(obj) {
.........

}

调用修饰

表示线程在方法调用时,额外的重要的操作。线程dump分析的重要信息。修饰上方的方法调用。

locked <地址> 目标:使用synchronized申请对象锁成功,监视器的拥有者。

waiting to lock <地址> 目标:使用synchronized申请对象锁未成功,在迚入区等待。

waiting on <地址> 目标:使用synchronized申请对象锁成功后,释放锁幵在等待区等待。

parking to wait for <地址> 目标

locked

at oracle.jdbc.driver.physicalconnection.preparestatement
- locked <0x00002aab63bf7f58> (a oracle.jdbc.driver.t4cconnection)
at oracle.jdbc.driver.physicalconnection.preparestatement
- locked <0x00002aab63bf7f58> (a oracle.jdbc.driver.t4cconnection)
at com.jiuqi.dna.core.internal.db.datasource.pooledconnection.preparestatement

通过synchronized关键字,成功获取到了对象的锁,成为监视器的拥有者,在临界区内操作。对象锁是可以线程重入的。

waiting to lock

at com.jiuqi.dna.core.impl.cacheholder.isvisiblein(cacheholder.java:165)
- waiting to lock <0x0000000097ba9aa8> (a cacheholder)
at com.jiuqi.dna.core.impl.cachegroup$index.findholder
at com.jiuqi.dna.core.impl.contextimpl.find
at com.jiuqi.dna.bap.basedata.common.util.basedatacenter.findinfo

通过synchronized关键字,没有获取到了对象的锁,线程在监视器的进入区等待。在调用栈顶出现,线程状态为blocked。

waiting on

at java.lang.object.wait(native method)
- waiting on <0x00000000da2defb0> (a workingthread)
at com.jiuqi.dna.core.impl.workingmanager.getworktodo
- locked <0x00000000da2defb0> (a workingthread)
at com.jiuqi.dna.core.impl.workingthread.run

通过synchronized关键字,成功获取到了对象的锁后,调用了wait方法,进入对象的等待区等待。在调用栈顶出现,线程状态为waiting或timed_wating。

parking to wait for

park是基本的线程阻塞原语,不通过监视器在对象上阻塞。随concurrent包会出现的新的机制,不synchronized体系不同。

线程动作

线程状态产生的原因

runnable:状态一般为runnable。

in object.wait():等待区等待,状态为waiting或timed_waiting。

waiting for monitor entry:进入区等待,状态为blocked。

waiting on condition:等待区等待、被park。

sleeping:休眠的线程,调用了thread.sleep()。

wait on condition 该状态出现在线程等待某个条件的发生。具体是什么原因,可以结合 stacktrace来分析。 最常见的情况就是线程处于sleep状态,等待被唤醒。 常见的情况还有等待网络io:在java引入nio之前,对于每个网络连接,都有一个对应的线程来处理网络的读写操作,即使没有可读写的数据,线程仍然阻塞在读写操作上,这样有可能造成资源浪费,而且给操作系统的线程调度也带来压力。在 newio里采用了新的机制,编写的服务器程序的性能和可扩展性都得到提高。 正等待网络读写,这可能是一个网络瓶颈的征兆。因为网络阻塞导致线程无法执行。一种情况是网络非常忙,几 乎消耗了所有的带宽,仍然有大量数据等待网络读 写;另一种情况也可能是网络空闲,但由于路由等问题,导致包无法正常的到达。所以要结合系统的一些性能观察工具来综合分析,比如 netstat统计单位时间的发送包的数目,如果很明显超过了所在网络带宽的限制 ; 观察 cpu的利用率,如果系统态的 cpu时间,相对于用户态的 cpu时间比例较高;如果程序运行在 solaris 10平台上,可以用 dtrace工具看系统调用的情况,如果观察到 read/write的系统调用的次数或者运行时间遥遥领先;这些都指向由于网络带宽所限导致的网络瓶颈。(来自)

二、命令格式

jstack [ option ] pid
jstack [ option ] executable core
jstack [ option ] [server-id@]remote-hostname-or-ip

 

常用参数说明

1)options: 

executable java executable from which the core dump was produced.(可能是产生core dump的java可执行程序)

core 将被打印信息的core dump文件

remote-hostname-or-ip 远程debug服务的主机名或ip

server-id 唯一id,假如一台主机上多个远程debug服务 

2)基本参数:

-f当’jstack [-l] pid’没有相应的时候强制打印栈信息,如果直接jstack无响应时,用于强制jstack),一般情况不需要使用

-l长列表. 打印关于锁的附加信息,例如属于java.util.concurrent的ownable synchronizers列表,会使得jvm停顿得长久得多(可能会差很多倍,比如普通的jstack可能几毫秒和一次gc没区别,加了-l 就是近一秒的时间),-l 建议不要用。一般情况不需要使用

-m打印java和native c/c++框架的所有栈信息.可以打印jvm的堆栈,显示上native的栈帧,一般应用排查不需要使用

-h | -help打印帮助信息

pid 需要被打印配置信息的java进程id,可以用jps查询.

 

线程dump的分析工具:

  • ibm thread and monitor dump analyze for java 一个小巧的jar包,能方便的按状态,线程名称,线程停留的函数排序,快速浏览。
  •  spotify提供的web版在线分析工具,可以将锁或条件相关联的线程聚合到一起。

 

 

三、使用实例

 1、jstack pid  

java命令--jstack 工具 查看JVM堆栈信息
~$ jps -ml
org.apache.catalina.startup.bootstrap 
~$ jstack 5661
2013-04-16 21:09:27
full thread dump java hotspot(tm) server vm (20.10-b01 mixed mode):

"attach listener" daemon prio=10 tid=0x70e95400 nid=0x2265 waiting on condition [0x00000000]
   java.lang.thread.state: runnable

"http-bio-8080-exec-20" daemon prio=10 tid=0x08a35800 nid=0x1d42 waiting on condition [0x70997000]
   java.lang.thread.state: waiting (parking)
    at sun.misc.unsafe.park(native method)
    - parking to wait for  <0x766a27b8> (a java.util.concurrent.locks.abstractqueuedsynchronizer$conditionobject)
    at java.util.concurrent.locks.locksupport.park(locksupport.java:156)
    at java.util.concurrent.locks.abstractqueuedsynchronizer$conditionobject.await(abstractqueuedsynchronizer.java:1987)
    at java.util.concurrent.linkedblockingqueue.take(linkedblockingqueue.java:399)
    at org.apache.tomcat.util.threads.taskqueue.take(taskqueue.java:104)
    at org.apache.tomcat.util.threads.taskqueue.take(taskqueue.java:32)
    at java.util.concurrent.threadpoolexecutor.gettask(threadpoolexecutor.java:947)
    at java.util.concurrent.threadpoolexecutor$worker.run(threadpoolexecutor.java:907)
    at java.lang.thread.run(thread.java:662)
........
java命令--jstack 工具 查看JVM堆栈信息

 

 #jstack -l 4089 >1.txt,查看1.txt内容如下所示:

java命令--jstack 工具 查看JVM堆栈信息
2014-03-14 10:47:04
full thread dump java hotspot(tm) client vm (20.45-b01 mixed mode, sharing):

"attach listener" daemon prio=10 tid=0x08251400 nid=0x11bd runnable [0x00000000]
   java.lang.thread.state: runnable

   locked ownable synchronizers:
        - none

"destroyjavavm" prio=10 tid=0xb3a0a800 nid=0xffa waiting on condition [0x00000000]
   java.lang.thread.state: runnable

   locked ownable synchronizers:
        - none

"query listener" prio=10 tid=0xb3a09800 nid=0x1023 runnable [0xb3b72000]
   java.lang.thread.state: runnable
        at java.net.plainsocketimpl.socketaccept(native method)
        at java.net.plainsocketimpl.accept(plainsocketimpl.java:408)
        - locked <0x70a84430> (a java.net.sockssocketimpl)
        at java.net.serversocket.implaccept(serversocket.java:462)
        at java.net.serversocket.accept(serversocket.java:430)
        at com.sun.tools.hat.internal.server.querylistener.waitforrequests(querylistener.java:76)
        at com.sun.tools.hat.internal.server.querylistener.run(querylistener.java:65)
        at java.lang.thread.run(thread.java:662)
locked ownable synchronizers:
        - none

"low memory detector" daemon prio=10 tid=0x08220400 nid=0x1000 runnable [0x00000000]
   java.lang.thread.state: runnable

   locked ownable synchronizers:
        - none

"c1 compilerthread0" daemon prio=10 tid=0x08214c00 nid=0xfff waiting on condition [0x00000000]
   java.lang.thread.state: runnable

   locked ownable synchronizers:
        - none

"signal dispatcher" daemon prio=10 tid=0x08213000 nid=0xffe runnable [0x00000000]
   java.lang.thread.state: runnable

   locked ownable synchronizers:
        - none

"finalizer" daemon prio=10 tid=0x0820bc00 nid=0xffd in object.wait() [0xb5075000]
   java.lang.thread.state: waiting (on object monitor)
        at java.lang.object.wait(native method)
- waiting on <0x7a2b6f50> (a java.lang.ref.referencequeue$lock)
        at java.lang.ref.referencequeue.remove(referencequeue.java:118)
        - locked <0x7a2b6f50> (a java.lang.ref.referencequeue$lock)
        at java.lang.ref.referencequeue.remove(referencequeue.java:134)
        at java.lang.ref.finalizer$finalizerthread.run(finalizer.java:171)

   locked ownable synchronizers:
        - none

"reference handler" daemon prio=10 tid=0x0820a400 nid=0xffc in object.wait() [0xb50c7000]
   java.lang.thread.state: waiting (on object monitor)
        at java.lang.object.wait(native method)
        - waiting on <0x7a2b6fe0> (a java.lang.ref.reference$lock)
        at java.lang.object.wait(object.java:485)
        at java.lang.ref.reference$referencehandler.run(reference.java:116)
        - locked <0x7a2b6fe0> (a java.lang.ref.reference$lock)

   locked ownable synchronizers:
        - none

"vm thread" prio=10 tid=0x08200000 nid=0xffb runnable

"vm periodic task thread" prio=10 tid=0x08222400 nid=0x1001 waiting on condition

jni global references: 1317
java命令--jstack 工具 查看JVM堆栈信息

 

一般情况下,通过jstack输出的线程信息主要包括:jvm自身线程、用户线程等。其中jvm线程会在jvm启动时就会存在。对于用户线程则是在用户访问时才会生成。

 

2、jstack 查看线程具体在做什么,可看出哪些线程在长时间占用cpu,尽快定位问题和解决问题

http://www.iteye.com/topic/1114219

java命令--jstack 工具 查看JVM堆栈信息
1.top查找出哪个进程消耗的cpu高。执行top命令,默认是进程视图,其中pid是进程号
21125 co_ad2    18   0 1817m 776m 9712 s  3.3  4.9  12:03.24 java                                                                                           
5284 co_ad     21   0 3028m 2.5g 9432 s  1.0 16.3   6629:44 ja

这里我们分析21125这个java进程
2.top中shift+h 或“h”查找出哪个线程消耗的cpu高 
先输入top,然后再按shift+h 或“h”,此时打开的是线程视图,pid为线程号
21233 co_ad2    15   0 1807m 630m 9492 s  1.3  4.0   0:05.12 java                                                                                           
20503 co_ad2_s  15   0 1360m 560m 9176 s  0.3  3.6   0:46.72 java                                                                                           

这里我们分析21233这个线程,并且注意的是,这个线程是属于21125这个进程的。 

3.使用jstack命令输出这一时刻的线程栈,保存到文件,命名为jstack.log。注意:输出线程栈和保存top命令快照尽量同时进行。
由于jstack.log文件记录的线程id是16进制,需要将top命令展示的线程号转换为16进制。

4. jstack查找这个线程的信息 jstack [进程]|grep -a 10 [线程的16进制] 即: jstack 21125|grep -a 10 52f1 -a 10表示查找到所在行的后10行。21233用计算器转换为16进制52f1,注意字母是小写。 结果: "http-8081-11" daemon prio=10 tid=0x00002aab049a1800 nid=0x52bb in object.wait() [0x0000000042c75000] java.lang.thread.state: waiting (on object monitor) at java.lang.object.wait(native method) at java.lang.object.wait(object.java:485) at org.apache.tomcat.util.net.jioendpoint$worker.await(jioendpoint.java:416)
在结果中查找52f1,可看到当前线程在做什么。
java命令--jstack 工具 查看JVM堆栈信息

 

3、代码示例

运行代码:

java命令--jstack 工具 查看JVM堆栈信息
/**
 * @author hollis
 */
public class jstackdemo1 {
    public static void main(string[] args) {
        while (true) {
            //do nothing
        }
    }
}
java命令--jstack 工具 查看JVM堆栈信息

先是有jps查看进程号:

hollis@hos:~$ jps
29788 jstackdemo1
29834 jps
22385 org.eclipse.equinox.launcher_1.3.0.v20130327-1440.jar

然后使用jstack 查看堆栈信息:

java命令--jstack 工具 查看JVM堆栈信息
hollis@hos:~$ jstack 29788
2015-04-17 23:47:31
...此处省略若干内容...
"main" prio=10 tid=0x00007f197800a000 nid=0x7462 runnable [0x00007f197f7e1000]
   java.lang.thread.state: runnable
    at javacommand.jstackdemo1.main(jstackdemo1.java:7)
java命令--jstack 工具 查看JVM堆栈信息

我们可以从这段堆栈信息中看出什么来呢?我们可以看到,当前一共有一条用户级别线程,线程处于runnable状态,执行到jstackdemo1.java的第七行。 看下面代码:

java命令--jstack 工具 查看JVM堆栈信息
/**
 * @author hollis
 */
public class jstackdemo1 {
    public static void main(string[] args) {
        thread thread = new thread(new thread1());
        thread.start();
    }
}
class thread1 implements runnable{
    @override
    public void run() {
        while(true){
            system.out.println(1);
        }
    }
}
java命令--jstack 工具 查看JVM堆栈信息

线程堆栈信息如下:

java命令--jstack 工具 查看JVM堆栈信息
"reference handler" daemon prio=10 tid=0x00007fbbcc06e000 nid=0x286c in object.wait() [0x00007fbbc8dfc000]
   java.lang.thread.state: waiting (on object monitor)
    at java.lang.object.wait(native method)
    - waiting on <0x0000000783e066e0> (a java.lang.ref.reference$lock)
    at java.lang.object.wait(object.java:503)
    at java.lang.ref.reference$referencehandler.run(reference.java:133)
    - locked <0x0000000783e066e0> (a java.lang.ref.reference$lock)
java命令--jstack 工具 查看JVM堆栈信息

我们能看到:

线程的状态: waiting 线程的调用栈 线程的当前锁住的资源: <0x0000000783e066e0> 线程当前等待的资源:<0x0000000783e066e0>

为什么同时锁住的等待同一个资源:

线程的执行中,先获得了这个对象的 monitor(对应于 locked <0x0000000783e066e0>)。当执行到 obj.wait(), 线程即放弃了 monitor的所有权,进入 “wait set”队列(对应于 waiting on <0x0000000783e066e0> )。

 

四、如何分析

1、线程dump的分析

原则

结合代码阅读的推理。需要线程dump和源码的相互推导和印证。

造成bug的根源往往丌会在调用栈上直接体现,一定格外注意线程当前调用之前的所有调用。

入手点

进入区等待

"d&a-3588" daemon waiting for monitor entry [0x000000006e5d5000]
java.lang.thread.state: blocked (on object monitor)
at com.jiuqi.dna.bap.authority.service.userservice$loginhandler.handle()
- waiting to lock <0x0000000602f38e90> (a java.lang.object)
at com.jiuqi.dna.bap.authority.service.userservice$loginhandler.handle()

线程状态blocked,线程动作wait on monitor entry,调用修饰waiting to lock总是一起出现。表示在代码级别已经存在冲突的调用。必然有问题的代码,需要尽可能减少其发生。

同步块阻塞

一个线程锁住某对象,大量其他线程在该对象上等待。

java命令--jstack 工具 查看JVM堆栈信息
"blocker" runnable
java.lang.thread.state: runnable
at com.jiuqi.hcl.javadump.blocker$1.run(blocker.java:23)
- locked <0x00000000eb8eff68> (a java.lang.object)
"blockee-11" waiting for monitor entry
java.lang.thread.state: blocked (on object monitor)
at com.jiuqi.hcl.javadump.blocker$2.run(blocker.java:41)
- waiting to lock <0x00000000eb8eff68> (a java.lang.object)
"blockee-86" waiting for monitor entry
java.lang.thread.state: blocked (on object monitor)
at com.jiuqi.hcl.javadump.blocker$2.run(blocker.java:41)
- waiting to lock <0x00000000eb8eff68> (a java.lang.object)
java命令--jstack 工具 查看JVM堆栈信息

持续运行的io io操作是可以以runnable状态达成阻塞。例如:数据库死锁、网络读写。 格外注意对io线程的真实状态的分析。 一般来说,被捕捉到runnable的io调用,都是有问题的。

以下堆栈显示: 线程状态为runnable。 调用栈在socketinputstream或socketimpl上,socketread0等方法。 调用栈包含了jdbc相关的包。很可能发生了数据库死锁

java命令--jstack 工具 查看JVM堆栈信息
"d&a-614" daemon prio=6 tid=0x0000000022f1f000 nid=0x37c8 runnable
[0x0000000027cbd000]
java.lang.thread.state: runnable
at java.net.socketinputstream.socketread0(native method)
at java.net.socketinputstream.read(unknown source)
at oracle.net.ns.packet.receive(packet.java:240)
at oracle.net.ns.datapacket.receive(datapacket.java:92)
at oracle.net.ns.netinputstream.getnextpacket(netinputstream.java:172)
at oracle.net.ns.netinputstream.read(netinputstream.java:117)
at oracle.jdbc.driver.t4cmarengine.unmarshalub1(t4cmarengine.java:1034)
at oracle.jdbc.driver.t4c8oall.receive(t4c8oall.java:588)
java命令--jstack 工具 查看JVM堆栈信息

分线程调度的休眠

正常的线程池等待

java命令--jstack 工具 查看JVM堆栈信息
"d&a-131" in object.wait()
java.lang.thread.state: timed_waiting (on object monitor)
at java.lang.object.wait(native method)
at com.jiuqi.dna.core.impl.workingmanager.getworktodo(workingmanager.java:322)
- locked <0x0000000313f656f8> (a com.jiuqi.dna.core.impl.workingthread)
at com.jiuqi.dna.core.impl.workingthread.run(workingthread.java:40)
java命令--jstack 工具 查看JVM堆栈信息

可疑的线程等待

java命令--jstack 工具 查看JVM堆栈信息
"d&a-121" in object.wait()
java.lang.thread.state: waiting (on object monitor)
at java.lang.object.wait(native method)
at java.lang.object.wait(object.java:485)
at com.jiuqi.dna.core.impl.acquirableaccessor.exclusive()
- locked <0x00000003011678d8> (a com.jiuqi.dna.core.impl.cachegroup)
at com.jiuqi.dna.core.impl.transaction.lock()
java命令--jstack 工具 查看JVM堆栈信息

入手点总结

wait on monitor entry: 被阻塞的,肯定有问题

runnable : 注意io线程

in object.wait(): 注意非线程池等待

 

2、死锁分析

学会了怎么使用jstack命令之后,我们就可以看看,如何使用jstack分析死锁了,这也是我们一定要掌握的内容。 啥叫死锁? 所谓死锁: 是指两个或两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。 说白了,我现在想吃鸡蛋灌饼,桌子上放着鸡蛋和饼,但是我和我的朋友同时分别拿起了鸡蛋和病,我手里拿着鸡蛋,但是我需要他手里的饼。他手里拿着饼,但是他想要我手里的鸡蛋。就这样,如果不能同时拿到鸡蛋和饼,那我们就不能继续做后面的工作(做鸡蛋灌饼)。所以,这就造成了死锁。 看一段死锁的程序:

java命令--jstack 工具 查看JVM堆栈信息
package javacommand;
/**
 * @author hollis
 */
public class jstackdemo {
    public static void main(string[] args) {
        thread t1 = new thread(new deadlockclass(true));//建立一个线程
        thread t2 = new thread(new deadlockclass(false));//建立另一个线程
        t1.start();//启动一个线程
        t2.start();//启动另一个线程
    }
}
class deadlockclass implements runnable {
    public boolean falg;// 控制线程
    deadlockclass(boolean falg) {
        this.falg = falg;
    }
    public void run() {
        /**
         * 如果falg的值为true则调用t1线程
         */
        if (falg) {
            while (true) {
                synchronized (suo.o1) {
                    system.out.println("o1 " + thread.currentthread().getname());
                    synchronized (suo.o2) {
                        system.out.println("o2 " + thread.currentthread().getname());
                    }
                }
            }
        }
        /**
         * 如果falg的值为false则调用t2线程
         */
        else {
            while (true) {
                synchronized (suo.o2) {
                    system.out.println("o2 " + thread.currentthread().getname());
                    synchronized (suo.o1) {
                        system.out.println("o1 " + thread.currentthread().getname());
                    }
                }
            }
        }
    }
}

class suo {
    static object o1 = new object();
    static object o2 = new object();
}
java命令--jstack 工具 查看JVM堆栈信息

当我启动该程序时,我们看一下控制台:

我们发现,程序只输出了两行内容,然后程序就不再打印其它的东西了,但是程序并没有停止。这样就产生了死锁。 当线程1使用synchronized锁住了o1的同时,线程2也是用synchronized锁住了o2。当两个线程都执行完第一个打印任务的时候,线程1想锁住o2,线程2想锁住o1。但是,线程1当前锁着o1,线程2锁着o2。所以两个想成都无法继续执行下去,就造成了死锁。

然后,我们使用jstack来看一下线程堆栈信息:

java命令--jstack 工具 查看JVM堆栈信息
found one java-level deadlock:
=============================
"thread-1":
  waiting to lock monitor 0x00007f0134003ae8 (object 0x00000007d6aa2c98, a java.lang.object),
  which is held by "thread-0"
"thread-0":
  waiting to lock monitor 0x00007f0134006168 (object 0x00000007d6aa2ca8, a java.lang.object),
  which is held by "thread-1"

java stack information for the threads listed above:
===================================================
"thread-1":
    at javacommand.deadlockclass.run(jstackdemo.java:40)
    - waiting to lock <0x00000007d6aa2c98> (a java.lang.object)
    - locked <0x00000007d6aa2ca8> (a java.lang.object)
    at java.lang.thread.run(thread.java:745)
"thread-0":
    at javacommand.deadlockclass.run(jstackdemo.java:27)
    - waiting to lock <0x00000007d6aa2ca8> (a java.lang.object)
    - locked <0x00000007d6aa2c98> (a java.lang.object)
    at java.lang.thread.run(thread.java:745)

found 1 deadlock.
java命令--jstack 工具 查看JVM堆栈信息

哈哈,堆栈写的很明显,它告诉我们 found one java-level deadlock,然后指出造成死锁的两个线程的内容。然后,又通过 java stack information for the threads listed above来显示更详细的死锁的信息。 他说

thread-1在想要执行第40行的时候,当前锁住了资源<0x00000007d6aa2ca8>,但是他在等待资源<0x00000007d6aa2c98>thread-0在想要执行第27行的时候,当前锁住了资源<0x00000007d6aa2c98>,但是他在等待资源<0x00000007d6aa2ca8> 由于这两个线程都持有资源,并且都需要对方的资源,所以造成了死锁。 原因我们找到了,就可以具体问题具体分析,解决这个死锁了。

其他

虚拟机执行full gc时,会阻塞所有的用户线程。因此,即时获取到同步锁的线程也有可能被阻塞。 在查看线程dump时,首先查看内存使用情况。

 

对于jstack做的threaddump的栈,可以反映如下信息():

  1. 如果某个相同的call stack经常出现, 我们有80%的以上的理由确定这个代码存在性能问题(读网络的部分除外);
  2. 如果相同的call stack出现在同一个线程上(tid)上, 我们很很大理由相信, 这段代码可能存在较多的循环或者死循环;
  3. 如果某call stack经常出现, 并且里面带有lock,请检查一下这个lock的产生的原因, 可能是全局lock造成了性能问题;
  4. 在一个不大压力的群集里(w<2), 我们是很少拿到带有业务代码的stack的, 并且一般在一个完整stack中, 最多只有1-2业务代码的stack,
  5. 如果经常出现, 一定要检查代码, 是否出现性能问题。
  6. 如果你怀疑有dead lock问题, 那么请把所有的lock id找出来,看看是不是出现重复的lock id。

 

jstack -m 会打印出jvm堆栈信息,涉及c、c++部分代码,可能需要配合来分析。

 

频繁gc问题或内存溢出问题

一、使用jps查看线程id

二、使用jstat -gc 3331 250 20 查看gc情况,一般比较关注perm区的情况,查看gc的增长情况。

三、使用jstat -gccause:额外输出上次gc原因

四、使用jmap -dump:format=b,file=heapdump 3331生成堆转储文件

五、使用jhat或者可视化工具(eclipse memory analyzer 、ibm heapanalyzer)分析堆情况。

六、结合代码解决内存溢出或泄露问题。

 

死锁问题

一、使用jps查看线程id

二、使用jstack 3331:查看线程情况

 

 

 

主要参考资料:

java命令学习系列(二)——jstack