在廣告LR模型中,為什麼要做特徵組合?

2021-08-08 21:01:21 字數 489 閱讀 5969

在廣告lr模型中,為什麼要做特徵組合?

在業界,lr模型之所以很受歡迎,主要是因為lr模型本質是對數線性模型,實現簡單,易於並行,大規模擴充套件方便,迭代速度快,同時使用的特徵比較好解釋,**輸出在0與1之間契合概率模型。(模型的可解釋性舉例,比如a-b的權重比較大,a代表使用者,b代表物品,那麼可以認為a是對b比較感興趣的)

但是,線性模型對於非線性關係缺乏準確刻畫,特徵組合正好可以加入非線性表達,增強模型的表達能力。

另外,廣告lr中,基本特徵可以認為是用於全域性建模,組合特徵更加精細,是個性化建模,因為在這種大規模離散lr中,單對全域性建模會對部分使用者有偏,對每一使用者建模又資料不足易過擬合同時帶來模型數量**,所以基本特徵+組合特徵兼顧了全域性和個性化。比如特徵向量中,有使用者a,b,c,物品e,f,g。基本的特徵a,b.c.e.f.g對應的權重,對應的是每個物件的偏置權重,但如果a偏好e,b偏好f,那麼組合特徵a-e,b-f就是對使用者的個性進行建模,組合特徵a-e,b-f的權重就是代表a對e的喜好,和b-f的喜好。

我們為什麼在今年要做亞馬遜?

現在來到了2021年,國外疫情十分緊張,很多人們居家隔離,這時候就會在網上購物。當然就是最大的平台類似於國內的某寶,某東。亞馬遜其平台所覆蓋的市場,基本上是目前世界上最核心的主流市場,如美國 德國 加拿大 英國 法國 義大利 西班牙 和日本,在這些國家亞馬遜平台都是在當地最大的網上購物平台。作為跨境...

邏輯回歸LR的特徵為什麼要先離散化

在工業界,很少直接將連續值作為特徵餵給邏輯回歸模型,而是將連續特徵離散化為一系列0 1特徵交給邏輯回歸模型,這樣做的優勢有以下幾點 1.稀疏向量內積乘法運算速度快,計算結果方便儲存,容易scalable 擴充套件 2.離散化後的特徵對異常資料有很強的魯棒性 比如乙個特徵是年齡 30是1,否則0。如果...

邏輯回歸LR的特徵為什麼要先離散化

在工業界,很少直接將連續值作為特徵餵給邏輯回歸模型,而是將連續特徵離散化為一系列0 1特徵交給邏輯回歸模型,這樣做的優勢有以下幾點 1.稀疏向量內積乘法運算速度快,計算結果方便儲存,容易scalable 擴充套件 2.離散化後的特徵對異常資料有很強的魯棒性 比如乙個特徵是年齡 30是1,否則0。如果...