第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機(jī)立即綁定

Hive 子進(jìn)程死循環(huán)問題排查

標(biāo)簽:
Spark

线上有个任务失败了,查看工作机器上运行的进程情况,有个进程比较陌生,如下图

webp


查看进程关系,可以看到这是hive起的一个子进程,如下图

webp


使用top命令查看cpu 使用情况,可以看到1193这个线程cpu占用总是接近100%,如下图

webp


使用jstack命令,查看线程状态

webp


看样子是在读取conf 文件,没有什么异常。然而过了一会儿再看这个状态,线程栈没有丝毫变化。而cpu使用仍然接近100%。一般来说这是进入死循环了。重试那个hive命令,发现问题无法重现,排除了conf文件的配置问题。使用strace命令查看系统调用情况

webp


发现也没有系统调用,确认是在用户态。那么应该就是代码中的bug,查看DefferredDocumentImpl.getNodeExtra 函数的代码,然而并没有循环。
这就很奇怪了,看getNodeExtra函数的代码,思来想去也不可能进入死循环。难道是内存漏洞引起的指令指针被改写,导致执行到莫名其妙的地方去了?这个时候我就希望看到1193这个线程现在在执行什么指令,总之应该不是getNodeExtra这个函数。那么jstack能不能输出这个信息呢。jstack --help看一下

webp


虽然不是我想要的具体在执行什么指令,不过也许问题确实出在本地方法栈呢。试一下

webp


看到问题真的出在本地方法,搜了一下关键字,找到了JDK的patch:https://bugs.openjdk.java.net/browse/JDK-8153134


这个问题的详细描述:https://marc.info/?l=openjdk-hotspot-compiler-dev&m=147625599902638&w=2

可见这是一个小概率的并发问题,由于我们线上集群也是第一次出现,决定暂不处理,直接重试任务即可。



作者:群演_
链接:https://www.jianshu.com/p/0949f47ed0aa


點(diǎn)擊查看更多內(nèi)容
TA 點(diǎn)贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優(yōu)質(zhì)文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學(xué)習(xí),寫下你的評論
感謝您的支持,我會繼續(xù)努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進(jìn)行掃碼打賞哦
今天注冊有機(jī)會得

100積分直接送

付費(fèi)專欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與 放棄機(jī)會
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

舉報

0/150
提交
取消