记录一次SpringBoot假死诊断|pe421c5常见故障及处理方法详解_家电

这两天遇到一个服务假死的问题，具体现象就是服务不再接收任何请求，客户端会抛出BrokenPipe。

执行top，发现CPU和内存占用都不高，但是通过命令

netstat-n|awk'/^tcp/{++S[$NF]}END{for(ainS)printa,S[a]}'+发现有大量的CLOSE_WAIT端口占用，继续调用该服务的api，等待超时之后发现CLOSE_WAIT的数量也没有上升，也就是说服务几乎完全僵死。

怀疑可能是线程有死锁，决定先dump一下线程情况，执行

jstack>/tmp/thread.hump+发现tomcat线程基本也正常，都是parking状态。

这就比较奇怪了，继续想是不是GC导致了STW，使用jstat查看垃圾回收情况

app@server:/tmp$jstat-gcutil1200010+S0S1EOMCCSYGCYGCTFGCFGCTGCT+0.0027.7965.0115.3094.7592.23133844.3751881475.064519.439+一看吓一跳，FGC的次数居然超过了YGC，时长有475s。一定是有什么原因触发了FGC，好在我们打开了GClog。

由于外部API暂时无法联系对方修改，所以为了先解决问题，对原有的MaxNewSize进扩容，从192MB扩容到一倍。经过几天的观察，发现gc基本趋于正常

S0S1EOMCCSYGCYGCTFGCFGCTGCT+0.003.3760.558.6095.0892.98872.42100.0002.421+扩容之前对heap进行了dump

jmap-dump:format=b,file=heapDump+通过MAT分析内存泄露，居然疑似是jdbc中的一个类，但其实整体占用堆容量并不多。

分析了线程数量，大约是240多条，与正常时也并没有很大的出入。而且大量的是在sleep的定时线程。

本次排查其实并未找到真正的原因，间接表象是FGC频繁导致服务假死。而且acturator端口是正常工作的，导致healthcheck进程误认为服务正常，没有触发告警。

THE END

记录一次SpringBoot假死诊断

福特E450有哪些常见的故障及解决办法？

长城炮增压压力不足

新型液晶彩电电源板维修精讲第4章TCL液晶彩电电源板维修精讲在线免费阅读

通过诱导对TROP?2表达细胞的免疫应答的疾病疗法的制作方法

远为SELETB50E187V03C5传感器全新现货销售批发厂家

室性早搏是否需要治疗？