大資料平台CDH和HDP

2021-08-19 23:33:28 字數 502 閱讀 7366

cdh (cloudera』s distribution, including apache hadoop),是hadoop眾多分支中的一種,由cloudera維護,基於穩定版本的apache hadoop構建,並整合了很多補丁,可直接用於生產環境。

cloudera manager則是為了便於在集群中進行hadoop等大資料處理相關的服務安裝和監控管理的元件,對集群中主機、hadoop、hive、spark等服務的安裝配置管理做了極大簡化。

cdh 安裝步驟

hdp(hortonworks data platform)是hortworks推出的100%開源的hadoop發行版本,以yarn 作為其架構中心,包含pig、hive、phoniex、hbase、storm、spark等大量元件,在最新的2.4版本,監控ui實現與grafana整合

hdp安裝步驟

原始碼路徑

apache原始碼

cdh原始碼

hdp原始碼

一 CDH6 2大資料平台搭建手冊

實際工作中搭建cdh集群的話,理論上來說,機子越多越好,如果資源有限的話,建議前期最好4臺機子,4臺機子的話,針對hadoop集群而言 可以設定為1主3從,如果考慮到ha的話,就需要最少5臺機子,本案例採用的伺服器配置如下 ip主機名 cpu記憶體 硬碟角色 172.20.9.1 hadoop1 8...

虛擬機器部署HDP大資料平台(1) 規劃準備篇

頂層設計規劃 1.宿主機環境準備 命令工具 iterm2 ftp工具 transmit 物理機 mac bookpro 虛擬機器 vmware fusion 虛擬機器系統 centos 7.4 大資料平台 hdp的ambari 2.集群機器準備 1 物理機配置 處理器 intel core i7 處...

大資料平台CDH集群資料遷移的常見問題與解決方案

一般而言,資料遷移常用於集群之間,但集群之間往往會出現cdh版本不同,那麼如何查詢集群的cdh版本呢?可以使用命令hadoop version檢視 不同版本的cdh的資料遷移方式也不一樣,下面來介紹下相同版本和不同版本cdh 的資料遷移方式 注意 ip1 源集群,ip2 目標集群 一 相同版本 使用...