請聊聊你所了解的推薦系統演算法

2021-09-28 20:07:46 字數 1221 閱讀 7653

一、content-based recommenders:推薦和使用者喜歡的商品相似的商品。主要是基於商品屬性資訊和使用者畫像資訊的對比。核心問題是如何刻畫啊商品屬性和使用者畫像以及效用的度量。方法包括:

1.1 heuristic-based method:對於特徵維度的構建,例如基於關鍵字提取的方法,使用if-idf等指標提取關鍵字作為特徵。對於效用的度量,例如使用啟發式cosine相似性指標,衡量商品特徵和使用者畫像的相似性,相似性越高,效用越大。

1.2 machine learning-based method:對於特徵維度的構建,使用機器學習演算法來構建使用者和商品的特徵維度。例如建模商品屬於某個類別的概率,得到商品的刻畫屬性。對於效用的度量,直接使用機器學習演算法擬合效用函式。

二、collaborative recommenders:推薦和使用者有相似品味和偏好的使用者喜歡過的商品。主要是基於使用者和商品歷史互動行為資訊,包括顯示的和隱式的。協同過濾方法進一步細分為:

2.1 memory-based cf:基於記憶體的協同過濾方法:直接對user-item矩陣進行研究。通過啟發式的方法進行推薦。核心要素包括相似性度量和推薦策略。相似性度量包括pearson或cosine等;而最簡單的推薦方法是基於大多數的推薦策略。

user-based cf:推薦給特定使用者列表中還沒有發生過行為、而在相似使用者列表中產生過行為的高頻商品。

item-based cf:推薦給特定使用者列表中還沒有發生過行為、並且和已經發生過行為的商品相似的商品。

基於流行學習的矩陣降維/分解演算法:svd、funksvd、biassvd、svd++、nmf等

基於表示學習的深度學習演算法:mlp、cnn、autoencoder、rnn等

其它:包括基於聚類的cf、稀疏因子分析cf、隱語義分析cf等等

2.3 hybrid cf:結合多種方式的cf演算法。如content-based cf、content-boosted cf或者結合memory-based和model-based cf混合方法。

當前推薦演算法主要是基於內容(cb)、協同過濾(cf)、混合演算法。基於內容的推薦依靠使用者profile和item的描述做推薦。cf基於過去的表現和行為推薦。由於種種原因,收集過去的行為比收集使用者畫像要容易,但cf又有他的侷限性,當打分(rating)很稀疏時,**精度會下降很厲害,同時,新產品的冷啟動也是cf的問題。因此,近年來,混合方法應用比較廣。

不為你所了解的諾基亞

公司型別public omx nok1v nyse nok stockholmsborsen noki frankfurter wertpapierborse noa3 成立時間芬蘭諾基亞 1865年 總部地點芬蘭埃斯波 重要人物fredrik idestam,founder jorma ollil...

你所了解的設計模式

定義 示例 singletonpattern 單例模式的特點 1 私有的構造方法 2 私有的靜態的變數 3 自定義的例項化的方法 public class singleton 要素2 靜態私有成員變數 private static singleton objinstance 要素3 public s...

你所不太了解的位運算

與 或 非 異或這些運算子的含義就不過多介紹了,本篇文章主要通過乙個例題來介紹如何靈活使用位運算子,來給我們的演算法錦上添花。例題如下 演算法 如下 class solution return ones 解題思路如下圖所示 考慮數字的二進位制形式,對於出現三次的數字,各二進位制位出現的次數都是3的倍...