機器學習中需要掌握的名詞

2021-09-24 20:10:02 字數 931 閱讀 8902

在機器學習中有很多名詞出現的頻率十分高,如果對這些名詞掌握不夠的話,我們是很難去深入理解機器學習的知識的。在這篇文章中我們就給大家介紹一下關於機器學習涉及到的專業名詞,希望由此來幫助大家鞏固機器學習方面的基礎。

(1)無監督機器學習就是訓練乙個模型尋找資料集中的模式。無監督機器學習最常用於將資料分成幾組類似的樣本。例如,無監督機器學習演算法可以根據**的各種屬性聚類資料。用這種方式收集的資料可以作為其他機器學習演算法的輸入。聚類在難以獲取真正標籤的情景中非常有用。無監督機器學習的另乙個例子是主成分分析。舉乙個例子就是將 pca 應用於包含數百萬購物車內容的資料集中時,就有可能發現有檸檬的購物車往往也有解酸劑。可與監督式機器學習對照閱讀。

(2)步就是乙個批量中的前向和後向評估。

(3)步長就是學習速率乘以偏導數的值,即梯度下降中的步長。

(4)隨機梯度下降就是批量大小為 1 的梯度下降演算法。也就是說,sgd 依賴於從資料集中隨機均勻選擇出的乙個樣本,以評估每一步的梯度。

(5)結構風險最小化中,演算法平衡兩個目標,第一就是構建**性最強的模型(如最低損失)。第二就是使模型盡量保持簡單(如強正則化)。在訓練集上的損失最小化 + 正則化的模型函式就是結構風險最小化演算法。

(6)監督式機器學習就是利用輸入資料及其對應標籤來訓練模型。監督式機器學習類似學生通過研究問題和對應答案進行學習。在掌握問題和答案之間的對映之後,學生就可以提供同樣主題的新問題的答案了。可與非監督機器學習對照閱讀。

(7)寬模型就是線性模型通常具備很多稀疏輸入特徵。我們稱之為寬模型,因其具有大量與輸出節點直接連線的輸入,是一種特殊型別的神經網路。寬模型通常比深度模型更容易除錯和檢查。儘管寬模型無法通過隱藏層表達非線性,但它們可以使用特徵交叉和 bucketization 等轉換用不同方式對非線性建模。可與深度模型對照閱讀。

機器學習名詞

訓練,測試,驗證 交叉驗證資料集 驗證集 驗證集 假設不知道結果,進行多次驗證 測試 機器學習模型只能在測試集上跑一次 過擬合 overfit 和欠擬合 underfit 過擬合 擬合的過於精確,沒什麼用 欠擬合 不夠 accuracy?precision?recall?比喻 你回答真但答案是假,這...

機器學習中的名詞釋義(一)

人工智慧 ai artificial intelligence 機器學習 ml machine learning 深度學習 dl deep learning 監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervi...

機器學習 專業名詞

機器學習 machine learning 知識圖譜 knowledge representation 推薦系統 recommender systems 監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervise...