一次核心bug引發的服務掛起血案

2021-10-12 16:23:05 字數 560 閱讀 6689

最近公司在客戶上線專案,客戶伺服器用的天翼雲。客戶一共用了6臺伺服器,其中5臺ecs,1臺rds。ecs中有2臺伺服器的應用在使用過程中頻繁掛起,表現形式為:服務程序還在,沒有oom,沒有任何日誌輸出,包括gc日誌和應用日誌。jstack jmap連不上程序,arthas也連不上程序。 messages、 dmesg也看不到異常訊息。一開始是通過重啟服務來解決。然後我發現乙個現象:就是如果使用jstack -f命令來檢視這些程序的運**況,在檢視之後服務會恢復正常。

歷時兩個月排查**無果的情況下,將問題原因定位在伺服器或者作業系統的問題。終於找到乙個比較可能的問題原因:這是乙個核心的bug引起的。

使用命令  cat /etc/redhat-release 檢視了下出問題的伺服器centos版本,版本號是:7.0.x。沒出問題的伺服器centos版本號是7.7.x。雖然文中提到出問題的版本是7.1,現在bug的表現跟文中一致,猜測7.0也會有這個bug。所以在備份好資料後公升級系統核心。使用命令  yum -y update 來更新核心,核心更新後檢視版本號為7.8.x。使用命令  reboot  重啟作業系統。公升級核心後此現象不再出現,說明公升級核心是有效果的。

記一次裝mysql服務引發的血案

從裝mysql服務之後,按原來的方式 原來的使用者名稱密碼 連線資料庫,可是不管怎樣都連線不上 這是什麼原因呢?我想了想,試試不填寫密碼看能不能成功,炸一試果然成功了,這下子可以好好複習複習dos命令抄作mysql了 但是高興的太早了,連線資料庫之後,顯示所有資料庫,炸一看怎麼只有三個資料庫了 分析...

Flash,一次Bug的思考

我絕對不算是f黑,大部分時候,我還是很挺flash平台的,flash提供了很好的跨平台特性以及flash player11後的gpu加速 stage3d等等,對於開發者來說,絕對讓人欣喜若狂 對我是這樣 flash出bug也算是常有的事,不過大都還好,我能理解adobe開發者們的辛苦,要考慮跨平台 ...

一次不該出現的bug

部門好久沒有出過事件了,ps 事件可以簡單的理解為bug,事件分為5個類別,其中嚴重的是1級,災難性的。但是這次是天災,避免不了。首先說說我們發布程式的過程,首先程式設計師發布到測試環境,測試人員測試通過,然後發布到uat,業務人員接著測,這個地方其實是很薄弱的,uat環境缺失很多資料,有的地方根本...