1 大資料概述

2022-09-23 12:09:09 字數 495 閱讀 1512

1.列舉hadoop生態的各個元件及其功能、以及各個元件之間的相互關係,以圖呈現並加以文字描述。

生態系統是乙個由許多元件組成的生態鏈,只有持續開發,hadoop生態系統才能不斷成熟,現在有多個子專案,核心hdfs和mapreduce,以及hadoop生態系統、zoopker、hbae、hive、pig、mahout、sqoop等等,包括flame和ambari等功能元件。這些元件涵蓋了當前行業中已處理的所有場景。

2.對比hadoop與spark的優缺點。

答:hadoop:兩步計算,磁碟儲存

spark:多步計算,記憶體儲存

spark是mapreduce的替代品,hdfs和hive相容性可以整合到hadoop生態系統來彌補mapreduce的缺點。

3.如何實現hadoop與spark的統一部署? 

他們在yarn上帶來的好處:

按需計算資源;

無負荷應用程式對映,高集群利用;

為了避免整個集群的資料轉移,共享基礎儲存。

1 大資料概述

大資料時代的三種標誌 大資料,雲計算,物聯網。雲計算概念 通過網路以服務的方式為使用者提供非常廉價的it資源。雲計算通俗點講就是把以前需要本地處理器計算的任務交到了遠端伺服器上去做。幾個雲計算的應用例項 第二是網頁遊戲。這其實也是一種雲計算應用,把以前需要在本地安裝的客戶端放到了網頁上,通過基於網頁...

1 大資料概述

1.借鑑網圖 2.兩者的各方面比較 1 spark對標於hadoop中的計算模組mr,但是速度和效率比mr要快得多 2 spark沒有提供檔案管理系統,所以,它必須和其他的分布式檔案系統進行整合才能運作,它只是乙個計算分析框架,專門用來對分布式儲存的資料進行計算處理,它本身並不能儲存資料 3 spa...

1 大資料概述

1.列舉hadoop生態的各個元件及其功能 以及各個元件之間的相互關係,以圖呈現並加以文字描述。答 主要的核心元件有hdfs和mapreduce,其他還包括zookeeper hbase hive pig mahout sqoop flume ambari等功能元件 hdfs hdfs具有很好的容錯...