推薦系統系列1 推薦系統評測指標

2021-08-17 07:51:11 字數 2090 閱讀 5639

0、前言: 

什麼才是好的推薦系統?這是推薦系統評測的需要解決的首要問題。那我們怎麼去判斷乙個系統的好壞呢?我們認為乙個好的推薦系統不僅僅能夠準確的**使用者的行為,而且還能夠擴充套件使用者的視野,幫助使用者發現那些他們可能會感興趣但卻不那麼容易發現的東西。 

評價乙個推薦系統的好壞一般有幾個不同的指標,這些指標包括:準確度、覆蓋度、新穎度、驚喜度、信任度

1、推薦系統實驗方法

1.1離線實驗:

(1)通過日誌系統獲得使用者行為資料,並按照一定格式生成乙個標準的資料集 

(2)將資料集按照乙個的規則分為訓練集和測試集 

(3)在訓練集上訓練使用者興趣模型,在測試集上進行** 

(4)通過事先定義的離線指標評測演算法在測試集上的**結果 

1.2使用者調查:

在完成離線實驗和必要的使用者調查後,可以將推薦系統上線做ab測試,將它和舊的演算法進行比較。

一般來說,乙個新的推薦演算法最終上線,需要完成上面三個實驗:

2、評測指標

現在,開始介紹各種推薦系統的評測指標。這些評測指標可用於評價推薦系統各方面的效能。

2.1使用者滿意度

**準確度是度量乙個推薦系統或者推薦演算法**使用者行為的能力。這個指標是乙個重要的推薦系統離線評測指標。**準確度可以分為評分**準確度和topn推薦準確度。 

評分**:很多提供推薦服務的**都有乙個使用者給物品打分的功能,如imdb電影**就會有使用者給電影打分的功能。那麼,如果知道了使用者對物品的歷史評分,就可以從找那個學習得到使用者的興趣模型,並**該使用者看到乙個沒有評分過的物品時會給該物品評多少分。評分**準確度一般通過均方根無差(rmse)和平均絕對誤差(mae)計算。 

rmse定義如下: 

mae定義如下: 

topn推薦:**在提付推薦服務時,一般是給使用者返回乙個個性化的推薦列表,這種推薦叫做topn推薦。topn推薦的準確度一般通過準確率(precision)和召回率(recall)來度量。

準確率定義如下: 

召回率定義如下: 

2.3覆蓋率

覆蓋率描述乙個推薦系統對物品長尾的發掘能力。覆蓋率有不同的定義,最簡單的定義為推薦系統能夠推薦出來的物品佔總物品集合的比例。這裡對覆蓋率不做過多的介紹,有興趣的可以自行查資料了解。 

2.4多樣性

使用者的興趣是廣泛的。比如說乙個使用者喜歡看《海賊王》等一類的動漫,也可能喜歡看科幻片。那麼,為了滿足使用者廣泛的興趣,推薦列表需要能夠覆蓋到使用者不同的興趣領域,即推薦結果需要具有多樣性。 

多樣性描述的是推薦列表中物品兩兩之間的不相似性。 

2.5新穎性

新穎的推薦是指給使用者推薦那些他們以前沒有聽過的物品。實現新穎性最簡單的方法是把那些使用者之前在**中對其有過行為的物品從推薦列表中過濾掉。但是過濾掉這些不能完全實現新穎性,有些無可能使用者在其他的地方有過行為。而評測新穎度的最簡單的方法是利用推薦結果的平均流行度,因為越不熱門的物品越可能讓使用者覺得新穎。因此,如果推薦結果中物品的平均流行度較低,那麼推薦結果就有可能有比較高的新穎性。 

2.6驚喜度

驚喜度是最近幾年推薦系統領域熱門的話題。目前對驚喜度沒有公認的定義,一般認為如果推薦結果和使用者的歷史興趣不相似,但卻讓使用者覺得滿意,那麼就可以說推薦結果的驚喜度很高,而推薦的新穎性僅僅取決於使用者是否聽過這個推薦結果。 

2.7其他

還有信任度、實時性、健壯性等指標,一般常用的就是上面介紹的幾種指標。

推薦系統之評測指標

前言 在接下來的一段時間,我將學習 推薦系統實踐 這本書,打算把每天學習的內容進行總結寫成部落格,今天是第一篇,主要內容是關於推薦系統的一些常見指標。1.推薦系統實驗方法 2.評測指標 2.1 使用者滿意度 2.2 準確度 準確度度量乙個推薦系統或者推薦演算法 使用者行為的能力,主要通過離線計算獲得...

推薦系統的評測指標

準確度度量乙個推薦系統或者推薦演算法 使用者行為的能力。這個指標是最重要的推薦系統離線評測指標,從推薦系統誕生的那一天起,幾乎99 與推薦相關的 都在討論這個指標。這主要是因為該指標可以通過離線實驗計算,方便了很多學術界的研究人員研究推薦演算法。但是上面的定義過於粗略。覆蓋率為 100 的系統可以有...

推薦系統評測指標之RMSE MSE

coding utf 8 fromloadmovielensimport importmath 評測指標 rmse 均方根誤差 mae 平均絕對誤差 defgetrmse prefer1,prefer2 rmse 0 forkey1,valueinprefer1.items zonghe 0 迭代測...