推薦演算法基礎之協同過濾

2021-10-01 22:20:36 字數 744 閱讀 7958

推薦演算法興起的原因是解決資訊過載問題。對於資訊過載問題,常見有兩種解決方式——搜尋引擎和推薦演算法。

作為推薦系統最基本的演算法之一——協同過濾,其在推薦演算法領域有著極為廣泛的應用。

協同過濾簡單來說是利用某興趣相投、擁有共同經驗之群體的喜好來推薦使用者感興趣的資訊,個人通過合作的機制給予資訊相當程度的回應(如評分)並記錄下來以達到過濾的目的進而幫助別人篩選資訊,回應不一定侷限於特別感興趣的,特別不感興趣資訊的紀錄也相當重要。

以使用者為基礎(user-based)的協同過濾(通過計算使用者之間相似度來推薦)和以專案為基礎(item-based)的協同過濾(通過計算物品之間相似度來推薦)統稱為以記憶為基礎(memory based)的協同過濾技術,他們共有的缺點是資料稀疏,難以處理大資料量影響即時結果,因此發展出以模型為基礎的協同過濾技術。 以模型為基礎的協同過濾(model-based collaborative filtering)是先用歷史資料得到乙個模型,再用此模型進行**。以模型為基礎的協同過濾廣泛使用的技術包括latent semantic indexing、bayesian networks…等,根據對乙個樣本的分析得到模型。另外一種分類方法(本質上都是能否處理大資料量)是以是否使用機器學習演算法。不使用機器學習演算法的稱為memory based,反之為model based。

一般說來,計算使用者之間的相似度比物品之間的複雜度要高的多,但是,通過計算使用者之間的相似度來進行推薦往往可以獲得較好的效果,而總是推薦相似的物品就比較普通。

當前協同過濾存在問題主要是資料稀疏和冷啟動問題。

協同過濾推薦演算法 協同過濾推薦演算法總結

推薦演算法具有非常多的應用場景和商業價值,因此對推薦演算法值得好好研究。推薦演算法種類很多,但是目前應用最廣泛的應該是協同過濾類別的推薦演算法,本文就對協同過濾類別的推薦演算法做乙個概括總結,後續也會對一些典型的協同過濾推薦演算法做原理總結。推薦演算法概述 1 基於內容的推薦 這一類一般依賴於自然語...

推薦演算法之協同過濾

舉例 以推薦使用者電影為例,假設有100w使用者,10w電影,使用者的id為uid1,uid2,uid3.電影的id為mid1,mid2,mid3.1 畫 橫座標表示所有電影,縱座標表示所有使用者,交叉點為某個使用者喜歡某部電影 mid1 mid2 mid3 mid4 mid5 mid10w uid...

推薦演算法之協同過濾

協同過濾的定義 通過找到興趣相投,或者有共同經驗的群體,來向使用者推薦感興趣的資訊。舉例 以推薦使用者電影為例,假設有100w使用者,10w電影,使用者的id為uid1,uid2,uid3.電影的id為mid1,mid2,mid3.1 畫 橫座標表示所有電影,縱座標表示所有使用者,交叉點為某個使用者...