H3C第一天 書 大資料技術原理與應用

2021-08-21 01:43:21 字數 799 閱讀 9244

前端框架:a、bootstrap

乘車路線:

考勤制度:

其他:  

key words:

1. spark  專為大規模資料處理而設計的快速通用的

計算引擎

。是開源的類hadoop mapreduce的

通用並行框架

,spark,擁有hadoop mapreduce所具有的優點;但不同於mapreduce的是——job中間輸出結果可以儲存在記憶體中,從而不再需要讀寫hdfs,因此spark能更好地適用於資料探勘與機器學習等需要迭代的mapreduce的演算法。

cataloge:

包括大資料

基礎篇(1、2)、儲存與管理(3、4、5、6)、

分析、應用

1. 概述

基礎all:基本概念和應用領域

大資料的4v:volume、variety、velocity、value(數量大、種類多、速度快、價值密度低)

當下三大網際網路技術: 雲計算,大資料,物聯網

其中大資料的很多分析技術都**於雲計算,mapreduce分布式並行處理框架提供了海量資料分析能力。

2. (處理架構)hadoop

3. (分布式檔案系統)hdfs           儲存理

4. (分布式資料庫)hbase

5. nosql資料庫

6. 雲資料庫

7. mapreduce

分析8.

hadoop 

9. spark

10.

流計算、圖計算、視覺化  以及大資料在各方面的應用      

大資料學習第一天

一.大資料本質 1 資料的儲存 分布式檔案系統 hdfs hadoop distributed file system 2 資料的計算 分布式計算 二.解決大資料儲存 分布式檔案系統 hdfs 於gfs 搭配hdfs,至少3臺機器全分布 三.hadoop出現的前提環境 概念的出現 1.分布式檔案系統...

學習c3和h5第一天

e first letter文字的第乙個單詞或字 如中文 日文 韓文等 e first line 文字第一行 e selection 可改變選中文字的樣式 e before和e after 在e元素內部的開始位置和結束位建立乙個元素,該元素為行內元素,且必須要結合content屬性使用 transl...

大資料學習第一天 Linux篇

在windows平台上安裝vmware虛擬機器,然後在虛擬機上安裝linux。安裝步驟詳見linux安裝文件。編輯配置檔案,新增修改以下內容 vi etc sysconfig network scripts ifcfg eth0 按i 進入文字編輯模式,出現游標,左下角會出現insert,即可以編輯...