4 2 核心元件

2022-04-29 12:12:09 字數 1032 閱讀 8870

1

、stage:虛的

一組rdd構成的鏈條

並行的task集合,同一stage的所有任務有著相同的shuffle依賴。

階段的劃分按照shuffle標記來進行的。

乙個階段含多個rdd,先有rdd後有stage

乙個階段含多個task

stage通過shuffledependency劃分,乙個stage都是narrowdependency

階段型別有兩種,shufflemapstage和resultstage。

-shufflemapstage

中間環節

該階段任務的結果是下乙個階段任務的輸入。需要跟蹤每個分割槽所在的節點。

任務執行期間的中間過程,儲存task的輸出資料供下乙個reduce進行fetch。

該階段可以單獨提交。

-resultstage

結果階段直接執行rdd的action操作。

對一些分割槽應用計算函式(不一定需要在所有分割槽進行計算,比如說first(),take(3))。

2、task:執行在乙個節點上,實的

乙個task包含乙個rdd整個的變換的過程

從最後乙個rdd的每個分割槽往前找他的依賴,就是它的任務;最後乙個rdd的分割槽數就是該階段的task數

是spark執行單位,有兩種型別。

-shuffelmaptask

在shufflemapstage由多個shufflemaptask組成。

-resulttask

resultstage由多個resulttask組成,結果任務直接task後,將結果回傳給driver。

3、job

乙個action就是乙個job

4 乙個應用可含多個job。

5、sparkcontext

spark上下文是spark程式的主入口點,表示到spark集群的連線。可以建立rdd、累加器和廣播變數。

每個jvm只能有個active的上下文,如果要建立新的上下文,必須stop掉原來的。

storm核心元件

nimbus 負責資源分配和任務排程。supervisor 負責接受nimbus分配的任務,啟動和停止屬於自己管理的worker程序。通過配置檔案設定當前 supervisor 上啟動多少個 worker worker 執行具體處理元件邏輯的程序。worker執行的任務型別只有兩種,一種是spout...

Openstack核心元件

compute 計算 object storage 物件儲存 identity 身份認證 dashboard 儀錶盤 block storage 塊儲存 network 網路 image service 映象服務 compute 類似計算的記憶體 object storage 類似儲存器 ident...

Spring Cloud 核心元件

spring cloud 核心元件,在微服務架構中,分別扮演的角色 1 eureka 各個服務啟動時,eureka client 都會將服務註冊到 eureka server,並且 eureka client 還可以反過來從 eureka server 拉取登錄檔,從而知道其他服務在 2 ribbo...