wide deep模型的認知未完結

wide&deep模型：深度加寬度的模型正規化，本身並不是乙個具體的模型，wide和deep部分可以用任意結構框架，wide的baseline是lr模型，deep的baseline是mlp模型(mlp指多層感知器，是一種籤祥結構的人工沉靜網路，對映一組輸入向量到一組輸出向量)

面試時會問這種不起眼的問題：

1、wide&deep模型是誰提出來的？那一年提出來的？你在哪知道這個模型的？

回答：wide&deep是由谷歌16年6月左右提出來的，

2、wide&deep中感覺wide時多餘的，可以去掉嗎？

回答：先帶著這個問題往下面繼續看吧！！！！！

wide&deep中谷歌提出兩個概念：記憶性和泛化性

舉例：人們的大腦很複雜，但是大腦可以記憶每天發生的事情(燕子會風，老鷹會風)然後泛化這些知識到之前沒有看到過的東西上(得出結論：有翅膀的動物多能飛)

但是，泛化的規則有時候不是特別的準，有時候會出錯(有翅膀的動物都能飛嗎)

這時候由於泛化的出錯，最終泛化的結果不准，但是記憶可以修改泛化的規則，

把(企鵝有翅膀但是不會飛，稱為特例)，兩者結合保證最後的輸出結果近似的正確。

聽完這段文字，應該就懂為什麼不能去掉wide端了吧。

wide—記憶性：wide部分常處於學習樣本的高頻部分，

優點是模型的記憶性好，對於樣本**現過的高頻低階特徵能夠用少量引數學習，

缺點：模型的泛化能力差，

例如：對於沒有見過的id類特徵，模型學習能力較差。

deep—泛化性：deep部分常處於學習樣本的長尾部分(長尾部分–名詞解析：俗話講，每次賺的很少，但是我每天可幹的次數很多)

優點是泛化能力強，對於少量出現過的樣本甚至沒有出現過的樣本都能做出**(非零embedding向量)，容易帶來驚喜，缺點是模型對於低階特徵的學習需要較多引數才能等同wide部分效果，而且泛化能力強，某種程度上也可能導致過擬合出現，尤其是對於冷啟動的一些item，也有可能給使用者帶來驚嚇。

俗話說：wide&deep模型就跟千里眼順風耳成為乙個人的技能。

wide模型使用ftrl加l1正則化來優化，

deep模型使用adagrad來優化

wide deep模型的認知 未完結