演算法學習Task2

2021-10-01 08:01:48 字數 355 閱讀 5306

1、主成分估計(偏向於概率):

設有p個回歸自變數,第i次試驗測得的實驗值,並將他們標準化消除量綱影響,記為(共n次實驗)

標準化方法(方法很多,基本上機器學習裡的一些歸一化都可用於標準化)

這樣就形成了n*p矩陣x

可構造回歸模型

β為p1的向量,ε為n1的誤差向量,β0為常量,1為n1的列向量

經過主成分轉換後

z=xη,η為x』*x的特徵向量,也是主成分的方向(本文開頭鏈結中有詳細證明),將x沿η的方向進行分解,即可得到型的主成分方向的實驗值,則回歸模型可轉換為

q為p個主成分方向所形成的矩陣

下面只需找出β很小的分量,然後將該分量的主成分刪除即可,判斷方法

基礎演算法學習Task2

3.邏輯回歸損失函式的推導及優化 4.正則化與模型評估指標 正則化 regularization 技術來防止過擬合情況,是機器學習中通過顯式的控制模型複雜度來避免模型過擬合 確保泛化能力的一種有效方式,分為l1正則化和l2正則化。l2正則化,其形式是在原先的損失函式後邊再加多一項 12 2i12 i...

深度學習Task2

讀入文字 分詞建立字典,將每個詞對映到乙個唯一的索引 index 將文字從詞的序列轉換為索引的序列,方便輸入模型 課後練習 語言模型 假設序列w1 w2 wt中的每個詞是依次生成的,我們有 語言模型的引數就是詞的概率以及給定前幾個詞情況下的條件概率。設訓練資料集為乙個大型文字語料庫,如維基百科的所有...

NLP 理論實踐 Task2

正向最大匹配法演算法流程 從前往後取詞,每次減乙個字,直至詞典命中或剩下1個單字。假設詞典中最長的單詞為 5 個,那麼最大匹配的起始子串字數也為 5 個 1 從左往右讀入子串,掃瞄字典,測試讀入的子串是否在字典中 2 如果存在,則從輸入中刪除掉該子串,重新按照規則取子串,重複 1 3 如果不存在於字...