03 Hadoop簡單介紹以及版本資訊

2022-05-15 11:04:21 字數 1091 閱讀 2338

一、海量資料:

量:大、數目多,資料量到達pb、zb級別,條目數到達幾十億條、百億條

1)儲存:分布式,集群的概念,管理(主節點、從節點),hdfs(hadoopdistributedfilesystem)

2)分析:分布式,並行,離線計算框架,管理(主節點、從節點),mapreduce

apachehadooplogo,乙隻會飛的大象

二、hadoop與google的關係

hdfs–>gfs開源檔案系統

hadoopmapreduce:核心就是對資料的排序優化

googlemapreduce–>hadoopmapreduce開源的分布式平行計算框架

bigtable-->    hbase開源的分布式資料庫

二、apachehadoop版本

經典版本:0.20.2、1.0.0(第乙個1.0.0正式版本)à1.0.3或者1.0.4(應用最多的版本)à1.1.2、1.2.1(截止2023年4月份)。

0.23.0(跨越版本,yarn框架,第二代mapreduce框架,資源管理和任務排程的框架)。

023.10版本,最新的,與2.x系列版本區別在於,沒有hdfs的ha和federation特性。

2.x版本:(將1.x系列版本與0.23.0系列版本的合併)

1)2.0.x版本:屬於2.x系列版本的alpha版本

2)2.1.x版本:屬於2.x系列版本的beta版本

3)2.2.0、2.3.0、2.4.0正式版本,可用於實際生產環境中。

03 Hadoop簡單介紹以及版本資訊

一 海量資料 量 大 數目多,資料量到達pb zb級別,條目數到達幾十億條 百億條 1 儲存 分布式,集群的概念,管理 主節點 從節點 hdfs hadoopdistributedfilesystem 2 分析 分布式,並行,離線計算框架,管理 主節點 從節點 mapreduce apachehad...

0 3 Hadoop高可用集群搭建

準備三颱相互免秘鑰的虛擬機器 上傳zookeeper 解壓 移動 解壓zookeeper的tar包 語法 tar zxf zookeeper 3.4.6.tar.gz 移動zookper目錄 語法 mv zookeeper 3.4.6 opt sxt 修改配置檔案zoo.cfg進入zookeeper...

Hadoop 簡單介紹

概述 hadoop是apache公司旗下乙個分布式基礎架構,主要解決大資料儲存和計算問題,是谷歌公司三篇 的具體實現 gfs hadoop,mapreduce mr,bigtable hbase 兩個版本 1.x版本的mapreduce既負責計算又負責資源的排程。2.x版本將mapreduce的資源...