推薦演算法大整理 分類

2021-10-11 20:54:55 字數 993 閱讀 1493

a. 基於流行度的演算法

基於流行度的演算法非常簡單粗暴,類似於各大新聞、微博熱榜等,根據pv、uv、日均pv或分享率等資料來按某種熱度排序來推薦給使用者。

這種演算法的優點是簡單,適用於剛註冊的新使用者。缺點也很明顯,它無法針對使用者提供個性化的推薦。基於這種演算法也可做一些優化,比如加入使用者分群的流行度排序,例如把熱榜上的體育內容優先推薦給體育迷,把政要熱文推給熱愛談***的使用者。

b. 協同過濾演算法

協同過濾演算法(collaborative filtering, cf) 包括基於使用者的cf(user-based cf)和基於物品的cf(item-based cf)。

基於使用者的cf原理如下:

分析各個使用者對item的評價(通過瀏覽記錄、購買記錄等);

依據使用者對item的評價計算得出所有使用者之間的相似度;

選出與當前使用者最相似的n個使用者;

將這n個使用者評價最高並且當前使用者又沒有瀏覽過的item推薦給當前使用者

缺點:依賴於準確的使用者評分;

在計算的過程中,那些大熱的物品會有更大的機率被推薦給使用者;

冷啟動問題。當有一名新使用者或者新物品進入系統時,推薦將無從依據;

在一些item生存周期短(如新聞、廣告)的系統中,由於更新速度快,大量item不會有使用者評分,造成評分矩陣稀疏,不利於這些內容的推薦。

之後再計算向量距離,便可以得出該使用者和新聞的相似度了。

總結:很好地解決冷啟動問題,並且也不會囿於熱度的限制,因為它是直接基於內容匹配的,而與瀏覽記錄無關。然而它也會存在一些弊端,比如過度專業化(over-specialisation)的問題。這種方法會一直推薦給使用者內容密切關聯的item,而失去了推薦內容的多樣性。

推薦演算法分類

1 item based collective filtering 總結 物以類聚 很多 的核心演算法之一 原因 item的增長速度遠小於user的增長速度 方法 離線計算item的相似度矩陣供線上使用 缺點 由於基於item的相似性,故推薦的item相似,缺乏多樣性 2 user based co...

推薦演算法專案(二)演算法分類

1.實時與離線 2.是否個性化,還是基於統計 3.基於模型去推薦,隨機規則 若使用者 a 與 使用者 b 相似,則推薦 a 使用者喜歡的物品給使用者 b 對於沒有明確含義的使用者資訊 登入時間,地域等sangxi 可以通過聚類等手段,給使用者打上分類標籤 對於特定標籤的使用者,又可以根據預設的規則 ...

python kNN基礎演算法 分類和推薦系統

1 k 近鄰演算法是分類資料最簡單最有效的方法。2 在將資料輸入到分類器之前,必須將待處理資料的格式改變為分類器可以接受的格式。3 所有的推薦模型都可以使用這個演算法,只要將結果量化就行了,主要是要考慮權重的設計。coding utf 8 數字型聚類分析 from numpy import impo...