設定Kettle7 1接CDH hadoop集群

在開始之前，你需要做一些事情。

驗證支援

檢查元件引用，以驗證您的kettle7.1版本支援您的mapr集群版本。

建立mapr集群

kettle7.1可以連線到安全的和不安全的mapr集群。

配置mapr集群。如果需要幫助，請參閱mapr的文件。

安裝任何必需的服務和服務客戶端工具。

測試群集。

設定mapr客戶端

將mpralhost環境變數設定為mapr客戶端的安裝位置。

如果在windows上安裝mapr 4.0.1，請使用版本4.0.1.31009ga或更高版本作為mapr客戶端。如果使用mapr 4.1.0，則使用mapr客戶端的4.1.0.31、175ga版本。該軟體可以從mapr獲得。

複習特定版本的注釋部分

閱讀特定版本的注釋部分，檢視您的mapr版本的特殊配置說明。

如果您連線到乙個安全的mapr集群，還有一些額外的事情需要做。

用kerberos保護mapr集群

tunaho支援kerberos身份驗證。你將需要：

在集群上配置kerberos安全性，包括kerberos域、kerberos kdc和kerberos管理伺服器。

配置名稱、資料、輔助名稱、作業***和任務***節點以接受遠端連線請求。

設定kerberos名稱、資料、輔助名稱，工作跟蹤，和任務跟蹤節點如果你已經部署了hadoop的使用企業級程式。

將每個應該訪問hadoop集群的pudiaho使用者的使用者帳戶憑據新增到kerberos資料庫中。確保每個使用者的hadoop集群要新增到kerberos資料庫在每個節點上的作業系統的使用者帳戶。如有必要，新增作業系統使用者帳戶。請注意，使用者帳戶uid必須大於最小使用者id值（m.u.s.id）。通常，最小使用者id值設定為1000。

在你的五音計算機上設定kerberos

如何在您的pathao計算機上設定kerberos出現了這樣的指令。

設定模擬

如果您將使用模擬，您還需要完成mapr模擬文章中的步驟。

如果你計畫使用欺騙或偽裝與mapr客戶，指定適當的使用者標識（uid），組id（gid），和名稱在mapr文件說明。（注意：確保您用於欺騙的帳戶是由客戶端和每個節點建立的。每個「欺騙」帳戶應該具有與客戶端相同的uid和gid。

在群集上不需要對*-test.xml配置檔案進行編輯。

配置五邊形元件墊片

必須為要連線到mapr集群的下列每個配置配置墊片：

spoon (pdi client)

pentaho server

pentaho report designer (prd)

pentaho metadata editor (pme)

作為最佳實踐，首先在調羹中配置墊片。spoon 具有幫助您測試配置的功能。然後將測試的spoon 配置檔案複製到其他元件，必要時進行更改。

您還可以選擇通過每個pentaho 元件的這些指令，而不是從spoon 複製墊片檔案。如果不打算從spoon 連線到群集，則可以先在另乙個元件中配置墊片。

如果不打算從spoon 連線到群集，則可以先將連線配置為另乙個元件。

設定Kettle7 1接CDH hadoop集群

kettle 設定變數

kettle 記憶體設定一次kettle效能優化

kettle連線設定字元編碼

設定Kettle7 1接CDH hadoop集群

kettle 設定變數

kettle 記憶體設定 一次kettle效能優化

kettle連線設定字元編碼

相關推薦

kettle 記憶體設定一次kettle效能優化