掌握Spark機器學習庫 01

2022-10-11 17:36:11 字數 727 閱讀 5148

第1章 初識機器學習

第一章內容筆記

機器學習

1)發展史

2)功能:分類、聚類、回歸

3)核心思想:統計學習、bp神經網路、深度學習

4)種類:監督、無監督、強化學習

6)程式語言:python、c++、scala

7)常用框架:

**於:

第1章 初識機器學習

第一章內容筆記

機器學習

1)發展史

2)功能:分類、聚類、回歸

3)核心思想:統計學習、bp神經網路、深度學習

4)種類:監督、無監督、強化學習

6)程式語言:python、c++、scala

7)常用框架:

Spark機器學習

spark機器學習 注 spark簡介 spark是乙個分布式計算框架,旨在簡化執行於計算集群上的並行程式的編寫。該框架對資源排程,任務的提交 執行和跟蹤,節點間的通訊以及資料並行處理的內在底層操作都進行了抽象。它提供了乙個更高階別的api用於處理分布式資料。spark支援的四種執行模式 本地單機模...

Spark學習01 Spark初識

中間結果輸出 基於mapreduce的計算引擎通常會將中間結果輸出到磁碟上,進行儲存和容錯。出於任務管道承接的,考慮,當一些查詢翻譯到mapreduce任務時,往往會產生多個stage,而這些串聯的stage又依賴於底層檔案系統 如hdfs 來儲存每乙個stage的輸出結果 是mapreduce的替...

spark機器學習庫評估指標總結

rmse 均方根誤差 mse 均方誤差 r2 擬合優度檢驗 mae 平均絕對誤差 mllib庫 ml庫 1.1.1 regressionmetrics介紹 這個類位於org.apache.spark.mllib.evaluation包下 class regressionmetrics since 1...