Hadoop 簡單問題2

2022-07-15 12:42:10 字數 827 閱讀 4040

1、大資料有哪些特點?

volume(大量)

velocity(高速)

variety(多樣)

value(低價值密度)

2、什麼是大資料?

大資料:指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。

3、大資料是用來解決什麼的?

主要解決:海量資料的儲存和海量資料的分析計算問題。

4、what is hadoop?

hadoop是乙個由apache**會所開發的分布式系統基礎構架。

主要解決,海量資料的儲存和海量資料的分析計算問題。

廣義上來說,hadoop通常是指乙個更廣泛的概念——hadoop生態圈。

5、hadoop有哪些優勢?

高可靠性:hadoop底層維護多個資料副本,所以即使hadoop某個計算元素或儲存出現故障,也不會導致資料丟失

高擴充套件性:在集群間分配任務資料,可方便的擴充套件數以千計的節點

高效性:在map reduce的思想下,hadoop是並行工作的,以加快任務處理速度。

高容錯性:能夠自動將失敗的任務重新分配。

6、sudo命令用處?

使使用者執行當前命令時具有root使用者的許可權。

7、使用sudo時有幾點需要注意的?

在 /etc/sudoers中配置使用者的許可權;

擁有sudo 許可權後,要尊重他人隱私;

要意識到,權力越大,責任越大。

9、中大型企業,大資料部門都由什麼組成?

由平台組、資料倉儲組、實時組、資料探勘組、報表開發組組成。

hadoop簡單了解

四大模組 三大核心 hdfs mapreduce yarn 生態圈 分布式系統 hdfs檔案系統的介紹 分而治之 將大檔案 大批量檔案,分布式存放在大量伺服器上,以便於採取分而治之的方式對海量資料進行運算分析 重點概念 檔案切塊副本存放元資料 namenode提供元資料服務,元資料資訊要載入到記憶體...

Hadoop簡單回憶

hadoop 主要就是用來解決大資料的儲存和計算問題的!那麼什麼是大資料那?資料量級很大的應用處理,資料集在tb及以上,或日增量在 g的資料!所以大資料的特點便是4v,何為4v?1 vomule 大量 資料量大至少為tb或日增gb以上的 2 variety 多樣 資料多樣,結構化資料,非結構化資料,...

Hadoop 簡單介紹

概述 hadoop是apache公司旗下乙個分布式基礎架構,主要解決大資料儲存和計算問題,是谷歌公司三篇 的具體實現 gfs hadoop,mapreduce mr,bigtable hbase 兩個版本 1.x版本的mapreduce既負責計算又負責資源的排程。2.x版本將mapreduce的資源...