Spark原始碼效能優化案例分析

本篇文章列舉了幾例常見的問題並給出了優化方案，推薦了兩套測試效能優化工具

問題:spark 任務檔案初始化調優資源分析，發現第乙個 stage 時間特別長，耗時長達 14s ， cpu 和網路通訊都有一定開銷，不符合應用**邏輯。

spark 任務排程優化資源分析，發現 stage2 只有一台伺服器上的 cpu 被使用，其他伺服器 cpu 完全空閒

任務分配演算法調優在做 log 分析的時候，發現在 executor 領取任務的時候，在最後總會有一兩個 executor 領取的任務是非 local 的。比如，最後兩個任務 a [ 2,3,1] 和 b[1,3,4] ， executor [ 1][2] ，當 executor[1] 領取了任務 a ，則 executor [ 2] 領到的任務 b 就是非 local 的。解決方案：對任務進行偏序排序後再分配 [spark-2193]

os 配置調優資源分析，發現伺服器大量 cpu 資源消耗為 sys 型別調查發現，是因為某些 linux 版本的 t ransparent huge page 預設為 enable 狀態導致優化方案：關閉 os 的 transparent huge pages echo never > /sys/kernel/mm/ transparent_hugepage /enabled echo never > /sys/kernel/mm/ transparent_hugepage / defrag transparent huge page 開啟 transparent huge page 關閉。

網絡卡調優資源分析，發現大量作業時間消耗在網路傳輸上。

Spark原始碼效能優化案例分析

spark效能優化

spark的效能優化

spark效能優化二

Spark原始碼效能優化案例分析

spark效能優化

spark的效能優化

spark效能優化二

相關推薦