推薦系統 內容推薦

2021-10-16 17:48:35 字數 902 閱讀 9687

使用者畫像(user profile)大體分為給機器看的和給人看的,其中給人看的一般是運營,產品等用的。我們這裡只關注給機器看的。我們知道要對使用者和物品進行計算,是需要對資料進行計算的,因此我們首先就要將使用者和物品都向量化,使用者向量化後的結果,就是user profile,俗稱「使用者畫像」,所以,使用者畫像不是推薦系統的目的,而是在構建推薦系統過程中產生的乙個關鍵環節的副產品。

使用者畫像的維度,在制定使用者畫像維度的時候,需要對每乙個維度都是可理解的,而維度的數量是自想的(假如是根據使用者的閱讀歷史挖掘閱讀興趣標籤,那麼我們無法提前知道使用者有哪些標籤,也就不能確定使用者畫像有哪些維度),有哪些維度也是自想的(維度越多越精細,個性化推薦就越強,但帶來的計算代價也就越大,這裡注意的是使用者畫像是向量化結果,而不是標籤化。標籤化知識向量化的一種)。

使用者畫像的構建,查戶口,對資料(積累歷史資料,做統計工作,就是歷史行為資料中去挖掘出標籤,然後在標籤維度中做資料統計,用統計結果作為量化結果),黑盒子(embedding)

首先我們要知道物品這一端也有大量文字資訊,可以用來構建物品畫像(通常有物品的標題,描述,物品本身的內容,物品的其他基本屬性的文字)

上面是典型基於內容推薦的框架圖

內容這一端:內容源經過內容分析,得到結構化的內容庫和內容模型,也就是物品畫像。使用者這一端:使用者看過推薦列表後,會產生使用者行為資料,結合物品畫像,經過使用者分析得到使用者畫像。以後對於那些沒有給使用者推薦過的新內容,經過相同的內容分析過程後就可以經過推薦演算法匹配,計算得到新的推薦列表給使用者。如此周而復始,永不停息。

內容分析和使用者分析:構建物品和使用者畫像…

內容推薦演算法:對於基於內容的推薦系統,最簡單的推薦演算法當然是計算相似性即可,使用者的畫像內容就表示為稀疏的向量,同時內容端也有對應的稀疏向量,兩者之間計算余弦相似度,根據相似度對推薦物品排序。

量,兩者之間計算余弦相似度,根據相似度對推薦物品排序。

推薦系統基礎演算法之基於內容的推薦演算法

基於內容的推薦方法的優點是 基於內容的推薦方法的缺點是 1.特徵 內容 提取,提取每個待推薦物品的特徵 內容屬性 例如電影 書籍 商品的分類標籤等。這些特徵往往分為兩種 結構化的特徵和非結構化的特徵。所謂結構化特徵就是特徵的取值限定在某個區間範圍內,並且可以按照定長的格式來表示。例如,電影類別特徵,...

推薦系統架構 推薦系統(1) 業界推薦系統架構

1.1業界主流推薦系統架構 業界推薦系統通用架構 1.2使用者本身資料 1.3物品本身資料 1.4使用者行為資料 2.1基於離線訓練的推薦系統架構設計 常用演算法 邏輯回歸 logistics regression 梯度提公升決策樹 gbdt 和因式分解 fm 架構設計 2.2面向深度學習的推薦系統...

推薦系統(1) 推薦系統概述

推薦系統是主動從大量資訊中找到使用者可能感興趣的資訊的工具。推薦系統的核心問題是如何實現推薦個性化 如何向使用者推薦匹配度高的產品 商品 或專案,本質是通過一定的方式將使用者和專案聯絡起來。自從xerox palo alto研究中心於1992年研發出了基於協同過濾的實驗系統tapestry以來 主要...