機器學習原理個人總結

2022-08-02 04:33:19 字數 699 閱讀 7752

1、用自己的話說明機器學習的四大分類: classification (分類)、 clustering (聚類)、regression (回歸)、dimensionality reduction (降維)。

1、回歸是對已有的資料樣本點進行擬合,再根據擬合出來的函式,對未來進行**。商品**走勢的**就是回歸任務。

2、分類需要先找到資料樣本點中的分界線,再根據分界線對新資料進行分類,分類資料是離散的值,比如識別領域會經常用到分類任務。

3、聚類是根據樣本之間的相似度,將一批資料劃分為多個組。

4、降維是減少資料的維度,對資料進行降噪、去冗餘,方便計算和訓練。如圖表視覺化,我們進行資料分析時,通常會將高維模型降為三維或二維圖表,便於直觀分析。

2、用自己的話說明正向傳播、反向傳播、梯度下降。

1、正向傳播就是已知引數和公式一步步的計算求得解。

2、反向傳播就是已知答案和公式一直盲猜未知數計算,直到接近答案求得引數。

3、梯度下降就是延梯度下降方向求解極小值,梯度向量接近於0的時候求得最小值。

3、用自己的話說明梯度消失和梯度**原因。

在對啟用函式求導時,其導數的取值範圍w在0和1之間,當求導層數過多時,小於0的值不斷相乘,最後就導致梯度消失的情況出現。同理,梯度**的問題也是如此,最後大於1的值不斷相乘,就會產生梯度**。

Lucene原理個人總結

傳統資料庫無法滿足的痛點 在mysql中,我們根據關鍵字去搜尋一般都是like 但是這樣搜尋的效能是很低的,因為沒有走索引。相關性搜尋,電商 中的根據瀏覽記錄做的商品推薦,在海量資料下直接查詢資料庫也是無法做到快速反應 倒排索引 類似這樣的資料結構,它是把值作為索引,比如說搜尋 我 的時候,在字典樹...

Weak 原理 個人學習總結

weak簡單來說是乙個雜湊表,key為修飾物件的位址,value為指向該位址的指標陣列。weak是由runtime初始化並維護的乙個weak表。在runtime的原始碼中由乙個objc weak檔案中進行定義了weak表的結構體及相關的方法。其中結構體中定義可乙個table weak t的乙個wea...

微機原理個人總結之中斷學習

中斷就是cpu遇到異常事件的時候停止當前程式去處理異常情況,並且在處理完異常狀況之後重新返回當前執行程式的過程。中斷分為硬體中斷和軟體中斷。硬體中斷分為可遮蔽中斷intr和非遮蔽中斷nmi。其中軟體中斷五個部分包括斷點 單步 除法 溢位等。程式可遮蔽中斷是通過外部中斷源控制的,其餘是硬體預先設定。可...