模型實現舉一反三

在很長一段時間裡，大家都對深度學習模型有所誤解，認為模型需要非常大量的資料訓練，且只能過訓練過的模式起作用——用貓的資料訓練就只能識別貓，只有在訓練資料中多次出現的模式才能被模型學習和應用，稍有變化，模型就無法正常工作。

實際上隨著深度學習模型的發展，這些問題都在逐步改善。現在很多模型學習的不僅是解決具體的問題，比如識別圖中的貓或者狗，還可以通過訓練學習資料間的關係，在更抽象的層面學習，從而實現了舉一反三。另外，隨著遷移學習的流行，將海量資料中學到的知識用於只包括少量資料的新場景之中也變成了一種趨勢。

本篇介紹幾種比較巧妙的方法解決訓練集中未出現過的問題。

one-shot問題

one-shot learning 指需要識別的物體在訓練樣本中很少出現，甚至在只出現一次的情況下，也能訓練模型。zero-shot與之類似，即使樣本在訓練資料中完全沒出現過，也能正確識別或分類。

搜尋是乙個one-shot問題，比如網購平台上有很多衣服，不可能每一件都放入模型訓練，搜尋的目標是找到與之同款的一種或多種同款商品。同一款衣服自然有很多類似特徵，比如顏色，質地，樣式等等，但是使用深度網路學習出來的知識散落在網路的各個引數之中，無法確定各個輸出的具體性質，並且中還包括不同背景，角度，以及人穿還是平鋪等多種因素。

風格遷移

風格遷移可以實現用一張的風格與另一張內容結合，生成新的功能，而非機械拼接。具體方法是先用預訓練的視覺模型提取各個層次的特徵，將某些層的目標結果設定為內容，某些層的目標結果設定為風格，反向調整內容。

其中提取風格的部分非常巧妙，模型計算每個通道輸出資料之間的關係。比如風格某兩個通道的輸出有同增同減的關係，就調節目標，使它在該層也有類似的輸出。

在風格遷移的任務中，被調整的不是網路引數，而是輸入網路的資料，這種方法也常用於在對抗攻擊中生成對模型更有攻擊性的資料（梯度攻擊）。

模擬推理

模擬推理是詞向量的一種應用，首先利用大量自然語言資料訓練詞向量，使得每一詞可使用n個屬性描述，然後通過屬性之間的運算實現推理，如：國王-王后=男-女，因此有：王后=國王-女+男。使用詞向量還可以計算詞間的距離。

通過遷移學習，讓仍用少量資料訓練的模型有更強的能力，比如：***與yyy在預訓練的詞向量模型提取的特徵非常類似，yyy在訓練集**現過，而***只在測試集**現，通過詞向量的遷移，使***與yyy學到的知識結合。

這種方法也常用於解決zero-shot問題，比如訓練資料中沒有老虎，但是通過與它近似的動物，以及用模型學到的各個特徵之間的關係，識別出中的老虎。

模型實現舉一反三

替換空格舉一反三

php上傳思路很重要舉一反三

舉一反三最長連續子串問題

模型實現舉一反三

替換空格 舉一反三

php上傳思路很重要 舉一反三

舉一反三 最長連續子串問題

相關推薦

替換空格舉一反三

php上傳思路很重要舉一反三

舉一反三最長連續子串問題