Spark程式設計基礎 課堂筆記(一)

2021-10-05 15:35:51 字數 1482 閱讀 7100

本文主要對廈門大學《spark》程式設計基礎課程知識點進行記錄

大資料4v特性

大資料關鍵技術

大資料計算模式

代表性大資料技術

hadoop裡面兩大核心:分布式儲存框架( hdfs ) & 分布式處理框架( mapreduce )。

hdfs負責海量分布式檔案的儲存yarn負責為上層的計算框架提供資源排程與管理服務mapreduce負責完成計算任務hive負責在乙個時間維度上儲存連續資料,建立在hdfs之上的,可以把hive看成是乙個介面,將查詢時使用的sql語句自動轉換為對hdfs的查詢分析,pig可以做資料清洗,轉換以及載入,在我們把資料儲存到資料倉儲之前,要對資料做清洗轉換,mahout實現了常用的資料探勘演算法hbase底層資料也是借助hdfs進行儲存的,flume負責日誌採集分析sqoop負責完成hadoop系統元件之間的互通

spark core完成rdd應用開發;spark sql分析關係資料;spark streaming進行流計算;mllib是機器學習演算法庫;graphx編寫圖計算應用程式。

( 與hadoop的分布式儲存框架結合 )

flink

flink和spark一樣,都屬於計算框架。

資訊保安基礎課堂筆記(一)

1 網路安全的核心目標 機密性 完整性 可用性。2 osi安全體系結構 安全攻擊 任何危機資訊系統安全的行為 安全機制 用來檢測 阻止攻擊或者從攻擊狀態恢復到正常狀態的過程 安全服務 為系統或資料傳輸提供足夠安全的協議層服務 3 網路安全模型 傳統加密技術的組成 明文 金鑰 加密演算法 密文 解密演...

vue基礎課堂一

1 例項化vue,根元素,資料儲存,方法的定義,資料的繫結 el element 需要獲取的元素,一定是html中存在的根容器元素 data 用於資料的儲存,可以是字串 陣列 json等等資料 methods vue當中寫方法的時候用的屬性,在html中呼叫的時候寫 方法名稱 就可以了 v bind...

C 基礎課堂筆記 中

第五章 陣列與集合 1.陣列 陣列 能存放任意多個同型別的資料 陣列由多個資料組成 型別必須相同 資料又叫陣列項,每個陣列都有乙個索引 下標 陣列的索引 下標 是乙個int型別的數字,索引 下標 從0開始,依次為陣列中每乙個陣列型編號 宣告 資料型別 變數名 賦值 變數名 new 資料型別 長度 合...