1、大資料有哪些特點?
volume(大量)
velocity(高速)
variety(多樣)
value(低價值密度)
2、什麼是大資料?
大資料:指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。
3、大資料是用來解決什麼的?
主要解決:海量資料的儲存和海量資料的分析計算問題。
4、what is hadoop?
hadoop是乙個由apache**會所開發的分布式系統基礎構架。
主要解決,海量資料的儲存和海量資料的分析計算問題。
廣義上來說,hadoop通常是指乙個更廣泛的概念——hadoop生態圈。
5、hadoop有哪些優勢?
高可靠性:hadoop底層維護多個資料副本,所以即使hadoop某個計算元素或儲存出現故障,也不會導致資料丟失
高擴充套件性:在集群間分配任務資料,可方便的擴充套件數以千計的節點
高效性:在map reduce的思想下,hadoop是並行工作的,以加快任務處理速度。
高容錯性:能夠自動將失敗的任務重新分配。
6、sudo命令用處?
使使用者執行當前命令時具有root使用者的許可權。
7、使用sudo時有幾點需要注意的?
在 /etc/sudoers中配置使用者的許可權;
擁有sudo 許可權後,要尊重他人隱私;
要意識到,權力越大,責任越大。
9、中大型企業,大資料部門都由什麼組成?
由平台組、資料倉儲組、實時組、資料探勘組、報表開發組組成。
hadoop簡單了解
四大模組 三大核心 hdfs mapreduce yarn 生態圈 分布式系統 hdfs檔案系統的介紹 分而治之 將大檔案 大批量檔案,分布式存放在大量伺服器上,以便於採取分而治之的方式對海量資料進行運算分析 重點概念 檔案切塊副本存放元資料 namenode提供元資料服務,元資料資訊要載入到記憶體...
Hadoop簡單回憶
hadoop 主要就是用來解決大資料的儲存和計算問題的!那麼什麼是大資料那?資料量級很大的應用處理,資料集在tb及以上,或日增量在 g的資料!所以大資料的特點便是4v,何為4v?1 vomule 大量 資料量大至少為tb或日增gb以上的 2 variety 多樣 資料多樣,結構化資料,非結構化資料,...
Hadoop 簡單介紹
概述 hadoop是apache公司旗下乙個分布式基礎架構,主要解決大資料儲存和計算問題,是谷歌公司三篇 的具體實現 gfs hadoop,mapreduce mr,bigtable hbase 兩個版本 1.x版本的mapreduce既負責計算又負責資源的排程。2.x版本將mapreduce的資源...