推薦演算法 入門介紹

2021-10-06 02:36:24 字數 1999 閱讀 1611

基於流行度的推薦比較粗暴,主要是對熱點商品或者資訊的推薦。主要是根據pv、uv、日均pv或分享率等資料來按某種熱度排序來推薦給使用者。

優點:簡單,適用於新註冊的使用者,解決冷啟動問題;

缺點:無法針對使用者提供個性化的推薦;優化方法:加入使用者分群的流行度排序,如把熱榜上的體育新聞推薦給體育迷

根據推薦物品或內容的元資料,發現物品或內容的相關性,再基於使用者以往的喜好記錄,推薦給使用者相似的物品。這種推薦系統多用於一些資訊類的應用上,針對文章抽取一些tag作為其關鍵字,繼而通過這些tag來評價兩篇文章的相似度。

優點:基於關聯規則的推薦演算法常用於電子商務。其實際意義是購買過一些商品的人可能會購買其他相關聯的商品。目前關聯規則的演算法主要從aprior和fp-growth兩個演算法發展演變而來。

優點:轉化率較高;

缺點:

1、計算量較大,但可以離線計算,因此影響不大;

2、由於採用使用者資料,不可避免存在冷啟動和稀疏性問題;

3、存在熱門專案容易被過度的推薦的問題

協同過濾是一種在推薦系統中廣泛應用的推薦演算法。基於「物以類聚,人以群分」的假設,喜歡相同物品的使用者可能具有相同的興趣,一般用於評分的系統之中。協同過濾推薦系統被分化為兩種型別:基於使用者(user-base)和基於物品(item-base)的推薦。

2.4.1 基於使用者推薦

該演算法的基本原理是,根據所有使用者對物品或者資訊的偏好(評分),發現與當前使用者口味和偏好相似的「鄰居」使用者群,在一般應用中採用計算k近鄰的演算法;基於這k個鄰居的歷史偏好資訊,為當前使用者進行推薦。

優點:推薦物品可能完全不相關;

缺點:一般在web系統中,使用者增長遠遠大於物品的增長速度,因此系統效能容易成為瓶頸。因此業界中單純基於使用者的協同過濾系統較少。

2.4.2 基於物品的推薦

使用所有使用者對物品或資訊的偏好(評分),發現物品和物品之間的相似度,然後根據使用者的歷史偏好推薦給使用者。基於物品的協同過濾可以看作是關聯規則推薦的一種退化,但是相對於關聯規則推薦準確率更高且覆蓋率高。

優點:相對於關聯規則推薦準確率更高且覆蓋率高;相對於使用者的協同推薦應用更廣泛、擴充套件性和演算法效能更好。

缺點:無法提供個性化的推薦結果。

2.4.3 協同過濾的總結

優點:不需要對物品或者使用者進行嚴格的建模,而且不要求物品的描述是機器可以理解的,所以這種方法也與領域無關。這種計算的推薦是開放的,可以共用他人的經驗,支援使用者發現潛在的興趣偏好。

缺點:基於歷史資料,對新物品和新使用者具有「冷啟動」的問題。推薦效果依賴使用者歷史偏好資料的多少和準確性。在大部分實現中,使用者歷史偏好是用稀疏矩陣進行儲存,稀疏矩陣在計算上有明顯的問題,包括可能少部分人的錯誤偏好會對推薦的準確度有很大的影響等等。對於一些特殊品味的使用者不能給與很好的推薦。由於歷史資料有基礎,抓取和建模使用者的偏好後,很難利用獲取使用者的偏好演變,導致方案不夠靈活。

2.5 基於模型的推薦演算法

基於模型推薦的方法有很多,主要使用常用的機器學習演算法對目標使用者簡歷推薦演算法模型,然後對使用者的愛好進行**推薦以及對推薦的結果打分排序。常用的模型包括aspect model,plsa,lda,聚類、svd、matrix factorization、lr、gbdt等。這種訓練方法較長,但是訓練後推薦過程比較塊且準確。因此比較使用於實時性比較高的新聞、廣告等。

優點:推薦過程快,準確性高;

缺點:需要人工干預反覆的進行屬性的組和和帥選,即常說的特徵工程;由於新聞需要時效性,系統也需要反覆更新線上的數學模型,以適應變化。

2.6 混合推薦演算法

推薦系統入門介紹

推薦系統 推薦系統是利用電子商務 向客戶提供商品資訊和建議,幫助使用者決定應該購買什麼產品,模擬銷售人員幫助客戶完成購買過程。個性化推薦是根據使用者的興趣特點和購買行為,向使用者推薦使用者感興趣的資訊和商品。隨著電子商務規模的不斷擴大,商品個數和種類快速增長,顧客需要花費大量的時間才能找到自己想買的...

C 入門推薦與介紹

入門推薦 c primer 這本書,簡直相當於一本字典,裡面內容很詳細。c 是c的超集,是在c語言基礎上開發的集物件導向程式設計 泛型程式設計和過程化程式設計於一體的程式語言。c 在c語言的基礎上新增了很多特性,包括 類和物件 繼承 多型 虛函式和rtti 執行階段型別識別 函式過載 引用變數 泛型...

推薦系統演算法介紹(二)

我們拿到的是使用者的一些基本資訊,或者根據使用者的上下文資訊得到使用者的標籤,這些標籤就屬於使用者的特徵,根據使用者的特徵可以找到跟使用者相似的使用者。相似的使用者具有相似的愛好,所以把物品推薦給使用者。最重要的資訊就是使用者的基本資訊,如年齡,性別。沒有使用者基本資訊,還可以收集沒有明確含義的使用...