線上系統奇怪問題總結,效能問題不能依賴經驗

2022-01-30 01:21:17 字數 515 閱讀 9777

曾經遇到乙個系統,會在乙個時間範圍內白屏,開發測試程式過程中從來沒有遇到過此類問題,

經過線上分析以及檢視系統資源使用情況和問題發生環境,發現在入庫時cpu占用為100%導致影響

整個系統使用。

查到問題通過同步控制抽取資料邏輯,並且抽取很快不會導致整個程式變慢。在不對程式進行很大

改動前提下完美解決問題。

另乙個問題已有系統歸檔資料特別慢,開始分析為伺服器資源緊張裝置io導致慢,後現場發現程式在

某個邏輯處會卡住很久,經查oracle

經過查程式定位某個邏輯耗時特別長,查詢資料庫最長耗費語句,發現某個語句無索引,加上索引程式效能提公升幾百倍。

需要總結的是不能有經驗依賴覺得是網路、磁碟io導致慢,效能問題要通過工具分析處理。

線上問題處理整理總結

1.處理磁碟空間滿的問題,查詢大於某個上限的檔案 find xdev size 500m exec ls l 2.避免停機 立即釋放空間的示例echo catalina.out 3.檢視磁碟空間檔案大小按照大小進行排序 du sh usr sort nr 記憶體oom問題分析 1.確認記憶體分配大小...

關於指標的一些總結性問題

demo 3.cpp 此檔案包含 main 函式。程式執行將在此處開始並結束。include pch.h include include 第乙個測試 void fun int p int main 第二個測試 void fun int p int main 第三個測試 void fun int p ...

ELK日誌系統的線上問題排查 Logstash問題

在公司搭建的分布式實時統一日誌平台,是通過felk的方式組建的,大致流程是 filebeat是和應用部署在乙個pod中的 k8s部署 目前的量為70 80個應用,資料一天50g.事故回放 有同學通知在kibana中查日誌,發現當天的某個時間段後都沒有日誌了,查之前的日誌都是ok的。找問題經過 1 k...