大資料相關知識

2021-09-10 06:51:56 字數 328 閱讀 6755

需要了解的內容:

1. spark常用函式:transformation和action

2. spark中task的生成:

spark中關於併發度涉及的幾個概念file,block,split,task,partition,rdd以及節點數、executor數、core數目的關係。

3. spark的job、stage、task是按何種規則產生的

4. spark中job,stage,task之間的關係(基本概念)

詳細版:

容易理解版:

hashmap的面試題你能回答幾個?

大資料相關基礎知識

apache hadoop專案包括以下四個主要模組 1 hadoop common hadoop的通用工具集 2 hadoop distributed file system hdfs 分布式檔案系統 3 hadoop yarn 任務排程 集群資源管理框架 4 hadoop mapreduce 基於...

大資料相關知識點記錄

1 apache druid 和 alibaba druid是兩個技術。apache druid是乙個為olap查詢需求而設計的開源大資料系統,druid提供低延時的資料插入,實時的資料查詢。簡單說,就是乙個資料庫系統。有乙個比其他資料庫系統好的特性是,預聚合。可以做max等計算操作。這個是比傳統關...

大資料相關資源

1,大資料不眠夜 spark核心天機解密 共140講 2,hadoop深入淺出實戰經典 3,spark純實戰公益大講壇 4,scala深入淺出實戰經典 5,docker公益大講壇 6,spark亞太研究院spark公益大講堂 4,spark亞太研究院決勝大資料時代公益大講堂 5,雲計算docker虛...