欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

常用的linux系统监控命令整理

程序员文章站 2022-05-25 11:05:21
记录一下自己常用的linux系统命令,方便以后查阅,发觉记忆越来越不行了... 12-03-18...
找到最耗cpu的java线程ps命令

命令:ps -mp pid -o thread,tid,time   或者  ps -lfp pid

结果展示:

常用的linux系统监控命令整理

 

这个命令的作用,主要是可以获取到对应一个进程下的线程的一些信息。 比如你想分析一下一个java进程的一些运行瓶颈点,可以通过该命令找到所有当前thread的占用cpu的时间,也就是这里的最后一列。

 

比如这里找到了一个tid : 30834 ,所占用的time时间最高。

通过 printf "%x\n" 30834 首先转化成16进制, 继续通过jstack命令dump出当前的jvm进程的堆栈信息。 通过grep命令即可以查到对应16进制的线程id信息,很快就可以找到对应最耗cpu的代码快在哪。

常用的linux系统监控命令整理

简单的解释下,jstack下这一串线程信息内容: 

 

"dboserviceprocessor-4-thread-295" daemon prio=10 tid=0x00002aab047a9800 nid=0x7d9b waiting on condition [0x0000000046f66000]

nid : 对应的linux操作系统下的tid,就是前面转化的16进制数字

tid: 这个应该是jvm的jmm内存规范中的唯一地址定位,如果你详细分析jvm的一些内存数据时用得上,我自己还没到那种程度,所以先放下

top命令

命令:top -hp pid 

结果显示:

常用的linux系统监控命令整理

 

和前面的效果一下,你可以实时的跟踪并获取指定进程中最耗cpu的线程。 再用前面的方法提取到对应的线程堆栈信息。

 

判断i/o瓶颈

mpstat命令

命令:mpstat -p all 1 1000

结果显示:

常用的linux系统监控命令整理

 

注意一下这里面的%iowait列,cpu等待i/o操作所花费的时间。这个值持续很高通常可能是i/o瓶颈所导致的。

通过这个参数可以比较直观的看出当前的i/o操作是否存在瓶颈

 

iostat命令

命令: iostat -m -x 1 1000


常用的linux系统监控命令整理

 

同样你可以观察对应的cpu中的%iowait数据,除此之外iostat还提供了一些更详细的i/o状态数据,比如比较重要的有: 

avgqu-sz :  the average queue length of the requests that were issued to the device. (磁盘队列的请求长度,正常的话2,3比较好。可以和cpu的load一样的理解)

await : the average time (in milliseconds) for i/o requests issued to the device to be served. (代表一个i/o操作从wait到完成的总时间)

svctm和%util都是代表处理该i/o请求花费的时间和cpu的时间比例。 判断是否瓶颈时,这两个参数不是主要的

 

r/s w/s 和 rmb/s  wmb/s 都是代表当前系统处理的i/o的一些状态,前者是我们常说的tps,后者就是吞吐量。这也是评价一个系统的性能指标

 

pid命令

命令: pidstat -p pid -u -d -t -w -h 1 1000

 

结果显示:
常用的linux系统监控命令整理

 

相当实用的一个命令,可以基于当个进程分析对应的性能数据,包括cpu,i/o,ir , cs等,可以方便开发者更加精细化的观察系统的运行状态。不过pidstat貌似是在2.6内核的一些较新的版本才有,需要安装sysstat包。

ubuntu下,可以通过sudo apt-get install sysstat进行安装。

sar命令

命令:sar -x pid 1 1000


常用的linux系统监控命令整理

 

sar也可以指定对应的pid,关注固定的几个参数,没有pidstat那么强大。 看不到对应的i/o, ir等信息。

sar的功能可以覆盖mpstat , iostat的相关功能。

dstat命令

命令:dstat -y --tcp 1 1000


常用的linux系统监控命令整理

 

通过dstat --tcp可以比较方便的看到当前的tcp的各种状态,不需要每次netstat -nat去看

 

其他命令

netstat -natp  :  查看对应的网络链接,关注下recv-q , send-q , state。

lsof -p pid :  查找对应pid的文件句柄

lsof -i : 80  : 查找对应端口被哪个进程占用

lsof  /tmp/1.txt :查找对应文件被哪个进程占用

 

tcpdump / wireshark :抓包分析工具

jstat / jmap / jstack / jps 等一系列的java监控命令

 

最后

  如果你想做一些性能调优的工作,一定要善于利用一些工具进行关注相应的状态。通过linux命令你可以比较方便的观测到cpu , i/o , network等一些比较外围的状态, 很多时候就已经可以解决大部分的问题。jvm内部的一些运行状态监控,得需要借助一些特有的工具进行细粒度的观测。