搜尋排序評估指標 NDCG

2022-06-16 09:06:17 字數 674 閱讀 8853

為了讓排序模型的優化目標盡量貼近搜尋業務指標,需要按照query計算損失,且不同位置的樣本具有不同的權重。搜尋系統常用的指標ndcg(normalized discounted cumulative gain)相較於log loss顯然更貼近搜尋業務的要求,ndcg計算公式如下:

累加部分為dcg(discounted cumulative gain)表示按照位置折損的收益,對於query下的結果列表l,函式g表示對應doc的相關度分值,通常取指數函式,即g(lj)=2lj-1(lj表示的是相關度水平,如);函式 η 即位置折損,一般採用 η(j)=1/log(j+1),doc與query的相關度越高且位置越靠前則dcg值會越大。另外,通常我們僅關注排序列表頁前k位的效果,zk 表示 dcg@k 的可能最大值,以此進行歸一化處理後得到的就是ndcg@k。

問題在於ndcg是乙個處處非平滑的函式,直接以它為目標函式進行優化是不可行的。lambdarank提供了一種思路:繞過目標函式本身,直接構造乙個特殊的梯度,按照梯度的方向修正模型引數,最終能達到擬合ndcg的方法[6]。因此,如果我們能將該梯度通過深度網路進行反向傳播,則能訓練乙個優化ndcg的深度網路,該梯度我們稱之為lambda梯度,通過該梯度構造出的深度學習網路稱之為lambdadnn。

搜尋評價指標 NDCG

概念 ndcg,normalized discounted cumulative gain 直接翻譯為歸一化折損累計增益,可能有些晦澀,沒關係下面重點來解釋一下這個評價指標。這個指標通常是用來衡量和評價搜尋結果演算法 注意這裡維基百科中提到了還有推薦演算法,但是我個人覺得不太適合推薦演算法,後面我會...

搜尋評價指標 NDCG

本文出自胖喵 的部落格 原文 概念 ndcg,normalized discounted cumulative gain 直接翻譯為歸一化折損累計增益,可能有些晦澀,沒關係下面重點來解釋一下這個評價指標。這個指標通常是用來衡量和評價搜尋結果演算法 注意這裡維基百科中提到了還有推薦演算法,但是我個人覺...

搜尋評價指標 NDCG

概念 ndcg,normalized discounted cumulative gain 直接翻譯為歸一化折損累計增益,可能有些晦澀,沒關係下面重點來解釋一下這個評價指標。這個指標通常是用來衡量和評價搜尋結果演算法 注意這裡維基百科中提到了還有推薦演算法,但是我個人覺得不太適合推薦演算法,後面我會...