问题现象
linux服务器(操作系统版本是centos7.9)上面部署了若干java站点服务,突然收到运维的cpu异常g告警,到了影响业务的情况发生,经初步排查,未出现异常进程,排除挖矿病毒的原因。
排查思路
(1)找到最耗cpu的进程;
(2)找到最耗cpu的线程;
(3)查看堆栈,定位线程在干嘛,定位对应代码;
排查步骤
1.找到最耗cpu的进程
方法:使用top命令
- 执行top -c ,显示进程运行信息列表
- 键入p (大写p),进程按照cpu使用率排序
2.找到最耗cpu的线程
方法:使用top工具
- top -hp ,显示一个进程的线程运行信息列表
- 键入p (大写p),线程按照cpu使用率排序
- top -hp 30365
3.查看堆栈,定位线程在干嘛,定位对应代码
- 首先,将线程pid转化为16进制。
- 工具:printf
- 方法:printf "%x\n" 6080
如上图,6080对应的16进制是0x17c0
之所以要转化为16进制,是因为堆栈里,线程id是用16进制表示的
4.查看堆栈,找到线程在干嘛
- 工具:jstack
- 方法:jstack 30365 | grep '0x17c0' -c5 --color
- 最后,根据堆栈里的信息,找到对应的代码.
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。
发表评论