AI新人必看引數和超引數還分不清楚嗎？

ai新人必看 | 引數和超引數還分不清楚嗎？

計算機學科裡有太多的術語，而且許多術語的使用並不一致。哪怕是相同的術語，不同學科的人理解一定有所不同。

比如說：「模型引數（model parameter）」和「模型超引數（model hyperparameter）」。

對於初學者來說，這些沒有明確定義的術語肯定很令人困惑。尤其是對於些來自統計學或經濟學領域的人。

我們來仔細研究一下這些條款。

什麼是模型引數？

模型引數是模型內部的配置變數，其值可以根據資料進行估計。

模型在進行**時需要它們。

它們的值定義了可使用的模型。

他們是從資料估計或獲悉的。

它們通常不由程式設計者手動設定。

他們通常被儲存為學習模型的一部分。

引數是機器學習演算法的關鍵。它們通常由過去的訓練資料中總結得出。

在經典的機器學習文獻中，我們可以將模型看作假設，將引數視為對特定資料集的量身打造的假設。

最優化演算法是估計模型引數的有效工具。

統計：在統計學中，您可以假設乙個變數的分布，如高斯分布。高斯分布的兩個引數是平均值（μ）和標準偏差（西格瑪）。這適用於機器學習，其中這些引數可以從資料中估算出來並用作**模型的一部分。

程式設計：在程式設計中，您可以將引數傳遞給函式。在這種情況下，引數是乙個函式引數，它可能具有乙個值範圍之一。在機器學習中，您使用的特定模型是函式，需要引數才能對新資料進行**。

模型是否具有固定或可變數量的引數決定了它是否可以被稱為「引數」或「非引數」。

模型引數的一些示例包括：

神經網路中的權重。

支援向量機中的支援向量。

線性回歸或邏輯回歸中的係數。

什麼是模型超引數？

模型超引數是模型外部的配置，其值無法從資料中估計。

它們通常用於幫助估計模型引數。

它們通常由人工指定。

他們通常可以使用啟發式設定。

他們經常被調整為給定的**建模問題。

我們雖然無法知道給定問題的模型超引數的最佳值，但是我們可以使用經驗法則，在其他問題上使用複製值，或通過反覆試驗來搜尋最佳值。

當機器學習演算法針對特定問題進行調整時（例如，使用網格搜尋或隨機搜尋時），那麼正在調整模型的超引數或順序以發現導致最熟練的模型的引數**。

「許多模型有不能從資料直接估計的重要引數。例如，在k近鄰分類模型中…因為沒有可用於計算適當值的分析公式，這種型別的模型引數被稱為調整引數。」

- 第64-65頁，《應用**模型》，2013

如果模型超引數被稱為模型引數，會造成很多混淆。克服這種困惑的乙個經驗法則如下：

如果必須手動指定模型引數，那麼它可能是乙個模型超引數。

模型超引數的一些例子包括：

訓練神經網路的學習速率。

用於支援向量機的c和sigma超引數。

k最近鄰的k。

總之，模型引數是根據資料自動估算的。但模型超引數是手動設定的，並且在過程中用於幫助估計模型引數。

模型超引數通常被稱為引數，因為它們是必須手動設定和調整的機器學習的一部分。

引數和超引數

舉例說明一些機器學習演算法中的普通引數和超引數機器學習演算法普通引數舉例超引數舉例決策樹在每個節點上選擇的輸入變數每個節點上選擇的閾值每個葉節點所應包括的最少資料量，訓練後的剪枝 pruning 策略隨機森林同上決策樹的數量，輸入變數的數量支援向量機支援向量 support ve...

模型引數和超引數

總結個人理解機器學習中的模型引數和模型超引數在作用等方面都有所不同，而模型超引數常被稱為模型引數，這樣，很容易對初學者造成混淆。本文給出了模型引數和模型超引數的定義，並進行了對比，指出了二者本質上的區別模型引數是模型內部的配置變數，可以用資料估計模型引數的值模型超引數是模型外部的配置，必須手...

引數和超引數的區別

計算機學科裡有太多的術語，而且許多術語的使用並不一致。哪怕是相同的術語，不同學科的人理解一定有所不同。比如說模型引數 model parameter 和模型超引數 model hyperparameter 對於初學者來說，這些沒有明確定義的術語肯定很令人困惑。尤其是對於些來自統計學或經濟學領域的...

AI新人必看 引數和超引數還分不清楚嗎？

引數和超引數

模型引數和超引數

引數和超引數的區別

相關推薦

AI新人必看引數和超引數還分不清楚嗎？