大資料測試環境搭建

2021-06-28 17:22:48 字數 420 閱讀 4310

hadoop集群搭建:

整理的很好

具體到我用的版本(2.4.1):

遇到的一些問題:

1. jdk版本問題

2. 環境變數配置問題

3. hadoop配置:core-site.xml, hdfs-site.xml等

4.資料夾許可權問題,(非root使用者必須具有hadoop相關資料夾及其子資料夾的寫許可權)

5. datanode啟動失敗:未停止hadoop服務的情況下重啟機器,導致namenode與datanode不一致(解決方法:在hdfs還沒有資料的前提下重新格式化namenode)

6. hadoop本地庫與系統版本不一致引發的問題:

以下元件只需在namenode節點下安裝即可

安裝flume:

安裝hive:

安裝oozie:

大資料測試環境常用操作語句

1.hdfs相關 hdfs dfs mkdir hdfs路徑 舉例 hdfs dfs mkdir opt data dspanalysis hdfs dfs rm r opt data dspanalysis 因有部分任務需要 success,下游程式才會繼續跑 hadoop fs touchz o...

大資料測試方法

一.功能性測試 大資料功能主要涉及系統實現面向大資料分析應用的posix api,包括檔案讀取與訪問控制,元資料操作,鎖操作等功能 大資料分析系統的posix語義不同,實現的檔案系統api也不同,功能測試要覆蓋到大資料系統涉及實現的api和功能點 功能測試工作量大,應該重點考慮應用自動化測試方法進行...

大資料測試小結

1.etl測試 etl,extract transform load 的縮寫,將資料從 端經過抽取 extract 轉換 transform 載入 load 至目的端的過程.etl工具較多,用過的是informatica.它從目標表抽取資料載入到結果表 hive 資料庫.測試思路 a.測試抽取的符合...