演算法學習Task2

1、主成分估計（偏向於概率）：

設有p個回歸自變數，第i次試驗測得的實驗值，並將他們標準化消除量綱影響，記為（共n次實驗）

標準化方法（方法很多，基本上機器學習裡的一些歸一化都可用於標準化）

這樣就形成了n*p矩陣x

可構造回歸模型

β為p1的向量，ε為n1的誤差向量，β0為常量，1為n1的列向量

經過主成分轉換後

z=xη，η為x』*x的特徵向量，也是主成分的方向（本文開頭鏈結中有詳細證明），將x沿η的方向進行分解，即可得到型的主成分方向的實驗值，則回歸模型可轉換為

q為p個主成分方向所形成的矩陣

下面只需找出β很小的分量，然後將該分量的主成分刪除即可，判斷方法

基礎演算法學習Task2

3.邏輯回歸損失函式的推導及優化 4.正則化與模型評估指標正則化 regularization 技術來防止過擬合情況，是機器學習中通過顯式的控制模型複雜度來避免模型過擬合確保泛化能力的一種有效方式，分為l1正則化和l2正則化。l2正則化，其形式是在原先的損失函式後邊再加多一項 12 2i12 i...

深度學習Task2

讀入文字分詞建立字典，將每個詞對映到乙個唯一的索引 index 將文字從詞的序列轉換為索引的序列，方便輸入模型課後練習語言模型假設序列w1 w2 wt中的每個詞是依次生成的，我們有語言模型的引數就是詞的概率以及給定前幾個詞情況下的條件概率。設訓練資料集為乙個大型文字語料庫，如維基百科的所有...

NLP 理論實踐 Task2

正向最大匹配法演算法流程從前往後取詞，每次減乙個字，直至詞典命中或剩下1個單字。假設詞典中最長的單詞為 5 個，那麼最大匹配的起始子串字數也為 5 個 1 從左往右讀入子串，掃瞄字典，測試讀入的子串是否在字典中 2 如果存在，則從輸入中刪除掉該子串，重新按照規則取子串，重複 1 3 如果不存在於字...

演算法學習Task2

基礎演算法學習Task2

深度學習Task2

NLP 理論實踐 Task2

相關推薦