shuffler 檔案定址與記憶體管理

2022-05-08 14:54:15 字數 889 閱讀 5441

shuffle 元件

mapoutputtracker 磁碟管理小檔案

1,主 mapoutputtrackermaster(存在於driver)

2,從 mapoutputtrackerworker(存在於executor)

blockmanager 塊管理者

1,blockmanagermaster(存在於driver)

1),diskstore 管理磁碟資料

2),memorystore 管理記憶體資料

3),connectionmanager 負責連線其他 blockmanager

4),blocktransferservice 負責拉取資料

2,blockmanagerworker(存在於executor)

1)也包含上述四項

spark 記憶體管理:

1,spark 1.6之前使用靜態記憶體管理,之後使用統一記憶體管理

2,指定記憶體兩種方式:

1),在spark-submit 之中使用 --conf來指定

2),在**之中進行指定

3,在shuffle 聚合記憶體之中,第一次拉取資料能放的下,以後拉取記憶體不足,就會自動寫到磁碟之中(有延遲),如果第一次拉取資料不成功,會有oom問題

4,spark.shuffle.memoryfraction=false 表示使用的是統一記憶體機制

linux 記憶體定址

1 實體地址 虛擬位址及線性位址 2 虛擬位址到實體地址的過程 記憶體定址的過程可以簡單理解為虛擬位址到實體地址的轉換過程。程式設計師所使用的虛擬位址,並不是直接送到記憶體匯流排,而是被送到記憶體管理單元 mmu,由乙個或一組晶元組成是一種硬體電路,實現虛擬位址到實體地址的轉換 mmu包括分段機制和...

記憶體定址(上)

每乙個邏輯位址由乙個段位址和偏移位址組成。在有位址變換功能的計算機中,訪問指令給出的位址 運算元 叫邏輯位址,也叫相對位址。由一塊連續的虛擬記憶體空間組成。在80x86微處理器中是乙個32位無符號整數,可以用來表示4gb的位址,也就是4294967個記憶體單元。是計算機內的實際位址,它們與從微處理器...

記憶體定址 筆記

方括號內的組建屬於硬體電路 memory arbiter記憶體仲裁器,介於匯流排和ram之間,用於判斷序列讀寫的ram此時能否被訪問。邏輯位址 16位的段選擇符 segment selector 32位偏移量 offset 段選擇符存放於6個段暫存器裡 cs code segment 段暫存器,它含...