Spark本地化原則

2021-10-19 14:18:02 字數 451 閱讀 4949

資料本地化對spark的應用程式效能具有重要的影響,當資料與計算該資料的**在一起,那應用的效能是很高的,如果資料與**不在同乙個地方,那麼就要將**移動到資料所在的節點中,因為移動**相比較於移動資料速度要快得多。

spark正是通過這樣的原則來分配排程task的。

資料本地化的五個級別,效能遞減:

// 預設等待時間是 3s

spark.locality.wait:

3// 擴充套件引數,預設值均是spark.locality.wait

spark.locality.process

spark.locality.node

spark.locality.rack

spark本地化原則排程任務原理:

本地化原則大大提高了spark的應用程式計算效能,我們可以通過實際經驗設定超時時間,避免等待時間過短產生降級。

本地化 日誌本地化

目錄 概要執行時日誌 國際化與本地化 定義你的本地化日誌資訊mymsg enum package org.skzr.logging basename charset utf 8 value org.skzr.logging.msglocallog public enum mymsg 定義國際化檔案o...

Spark效能優化 資料本地化優化

資料本地化對於spark job效能有著巨大的影響。如果資料以及要計算它的 是在一起的,那麼效能當然會非常高。但是,如果資料和計算它的 是分開的,那麼其中之一必須到另外一方的機器上。通常來說,移動 到其他節點,會比移動資料到 所在的節點上去,速度要快得多,因為 比較小。spark也正是基於這個資料本...

Swift 匯出本地化和匯入本地化

一。匯出本地化 1.如下設定,來新增本地化語言 2.匯出檔案 儲存完成後 生成以下兩個檔案 然後用xlifftool 分別開啟以上兩個檔案 在以下顯示 no translation 的地方,新增英文所要替代的語言,如下所示 然後儲存就可以了 二.匯入本地化 1.按如下步驟 2.新增 3新增後出現以下...