我的雲之旅 hadoop集群整合Hive 4

2021-05-28 02:13:33 字數 387 閱讀 4783

hive: 可以對資料轉換為類sql執行,呼叫hadoop mapreduce進行分布式計算。據說facebook的95%統計分析由此進行。有了分布式後ad hoc查詢也變成可能。所以該軟體還是不錯的。

1 單機安裝可參考官網

2 和hadoop整合步驟

2.1 安裝好hadoop

2.2 job tracker根據自身的配置進行調整

set mapred.job.tracker=myhost.mycompany.com:50030;

同樣檔案位置也一樣進行調整 hostname:9000 具體忘了,應該是這個

2.3 cli進行測試

hwi可以在頁面進行檢視當前運**況和結果。和cli類似。

hadoop 學習入門 一 雲計算之旅

一 什麼是雲計算 雲計算是分布式計算 網格計算 平行計算 效用計算 網路儲存 負載均衡 虛擬化 網路計算等傳統計算技術的融合體。二 雲計算的核心技術 1 程式設計模型 2 海量資料分布儲存技術 3 海量資料管理技術 4 虛擬化技術 5 雲計算平台管理技術 三 雲計算的特點 易管理 無需基礎設施的維護...

我在創業公司的雲原生之旅

it是一座道場!2020年5月中旬本科畢業後,進入嚴格意義上的第一家公司。當時帶我的是阿里雲的mvp,也是公司的cto,跟著他 石老大 學到了很多很多,帶領我經過了入道 機會,不是人人都有,請感恩,給你機會和幫助的人 三個月後他離職了,感謝石老大,正是他的離職給了我獨自闖道的機會。2020年9月開始...

通過公網IP訪問雲上的Hadoop集群

背景 從公司內部網路中的hadoop集群訪問部署在亞馬遜雲的hadoop集群 1.ip 網域名稱設定 1.1 給雲上每個例項設定乙個內網ip 如上圖10.0.0.5 1.2 給雲上每個例項繫結乙個elastic ip 彈性ip,如上圖x.x.x.1 並且與內網ip一一對應 1.3 給雲上每個例項配置...