基於近鄰的協同過濾

2021-08-21 21:14:13 字數 967 閱讀 1658

收集資料生成使用者商品評分矩陣,構建使用者或商品相似度矩陣,利用近鄰使用者或近鄰商品的評分進行加權平均求和得到當前使用者沒有瀏覽過的產品評分,選擇該使用者對沒有瀏覽過的評分topn的產品列表推薦給當前使用者

在usercf中使用pearson相似度比較多

在itemcf中使用改進余弦相似度比較多

加權平均求和、基於均值計算的加權平均求和、基於偏置項計算的加權平均求和(效果最好)

1.利用混合方法進行推薦,利用外部特徵對樣本進行分類、聚類建模

2.topn熱銷推薦,新品推薦

1.使用相對較少的有效評分來**。

2.利用使用者/物品的額外特徵屬性進行分類、聚類操作來得到相似使用者/物品列表。

3.可以使用預設投票的形式補全評分資料

評分一般採用兩分制、五分制、七分制、十分制四種。通過以下兩種方式

1.顯示評分:通過問卷調查的方式收集使用者對於商品的評分

topn過濾、閾值過濾、負數過濾,交叉驗證,一般25~50之間

可以根據規則/業務特徵對使用者-物品評分進行加權,加權之後再對推薦列表做乙個排序,最終產生推薦結果

1、**準確度:比如mae,rmse

2、分類準確度:

分類準確度定義為推薦演算法對乙個產品使用者是否喜歡判定正確的比例。因此 ,當使用者只有二元選擇時 ,用分類準確度進行評價較為合適。因此,想要用準確率和召回率評價推薦演算法,必須將評分分為兩部分,高於某個評分,表示喜歡,低於這個評分,表示不喜歡。

準確率和召回率:

準確率定義為系統

的推薦列表中使用者喜歡的產品和所有被推薦產品的比率:,準確率表示使用者對乙個被推薦產品感興趣的可能性。

召回率定義為推薦列表中使用者喜歡的產品與系統中使用者喜歡的所有產品的比率,召回率表示乙個使用者喜歡的產品被推薦的概率。

協同過濾 基於使用者的協同過濾itemCF

基於使用者的協同過濾演算法也被稱為最近鄰協同過濾或knn k nearest neighbor,k最近鄰演算法 其核心思想就是,首先根據相似度計算出目標使用者的鄰居集合,然後用鄰居使用者評分的加權組合來為目標使用者作推薦。通常這些演算法都可以總結成三步 首先,使用使用者已有的評分來計算使用者之間的相...

基於使用者協同過濾與基於專案協同過濾的適用場景

一 在適合用途上的比較 基於使用者的協同過濾演算法主要有兩步 1 找到和目標使用者興趣相似的使用者集合 2 找到這個集合中的使用者喜歡的,且目標使用者沒有聽說過的物品推薦給目標使用者。基於物品的協同過濾演算法主要有兩步 1 計算物品之間的相似度。2 根據物品的相似度和使用者的歷史行為給使用者生成推薦...

基於使用者協同過濾與基於專案協同過濾的適用場景

一 在適合用途上的比較 基於使用者的協同過濾演算法主要有兩步 1 找到和目標使用者興趣相似的使用者集合 2 找到這個集合中的使用者喜歡的,且目標使用者沒有聽說過的物品推薦給目標使用者。基於物品的協同過濾演算法主要有兩步 1 計算物品之間的相似度。2 根據物品的相似度和使用者的歷史行為給使用者生成推薦...