Spark on YARN 的一些碎碎念

2021-09-22 10:13:29 字數 1132 閱讀 3177

adventage:

speed,

tasks can start up very quickly

in memory

worker:

yarn 中是沒有這個概念的 因為 executor runs in container(memory of container > executor memory)

客戶端提交作業(包含咋driver裡面),先去rm->am->am申請資源->啟動container執行executor

spark 僅僅只是乙個客戶端而已

基於yarn的resource manager的client模式:driver執行在client process。這樣am的職責就只是申請資源

spark-submit --master yarn

或者 spark-submit --master yarn --deploy-mode client

基於yarn的resource manager的cluster模式:driver在am中,當driver在再am中初始化完成後client可以go away。am不僅要申請資源,還需要進行task schedule(本來由driver做,但跑在am中,所以一塊了)

–master yarn 不能用spark-shell起

options:

–driver-memory men 預設1024g

–executor-memory men 預設1g

cluster deploy mode only:

–driver-cores num 預設1

yarn only

–executor-cores num 預設1

–num–executors num 預設2

spark.yarn.am.memory

預設值:512m

spark.driver.memory

預設值:512m

spark.yarn.am.cores

預設值:1

spark.driver.cores

預設值:1

一些碎碎念

一般分兩步,第一步,一般會在middleware 中統一進行,會和登陸耦合在一起 具體是使用者首先通過使用者名稱密碼證明自己的身份,然後獲得token 一類的儲存在cookie 裡的東西,然後使用者後面訪問時把這個東西放在請求中 這裡會有乙個問題,比如使用者剛開始是某個組的成員,但是之後被踢出組,有...

python的一些碎碎念

將資料輸出檔案中 fp open d text.txt a a 表示 如果檔案不存在就建立,存在就在檔案內容後面繼續追加 print hello world file fp fp.close 轉義字元 n t r b 若不希望字串中的轉義字元起作用,就在字串之前加上r,或者r print r hel...

關於工作的一些碎碎念

技術上已經很久沒提公升了,最近實在比較忙,也學到了很多技術之外的東西。以下內容不斷更新修改 1 不與上級討論技術細節,只反饋什麼時候做,需要多久。2 不隨便提問題,問問題之前理清思路,目的性要明確。3 與部門外的同事,比較重要事項的交流一定要使用郵件,避免表達不準確,也是乙個記錄,雙方都可以隨時查閱...