如何實現基於內容和使用者畫像的個性化推薦

2021-09-23 07:19:01 字數 962 閱讀 3839

基於內容和使用者畫像的個性化推薦,有兩個實體:內容和使用者。需要有乙個聯絡這兩者的東西,即為標籤。內容轉換為標籤即為內容特徵化,使用者則稱為使用者特徵化。

因此,對於此種推薦,主要分為以下幾個關鍵部分:

綜合上面講述的各個部分即可實現乙個基於內容和使用者畫像的個性化推薦系統。如下圖所示:

標籤庫

標籤是聯絡使用者與物品、內容以及物品、內容之間的紐帶,也是反應使用者興趣的重要資料來源。標籤庫的最終用途在於對使用者進行行為、屬性標記。是將其他實體轉換為計算機可以理解的語言關鍵的一步。

標籤庫則是對標籤進行聚合的系統,包括對標籤的管理、更新等。

一般來說,標籤是以層級的形式組織的。可以有一級維度、二級維度等。

標籤的**主要有:

內容特徵化

內容特徵化即給內容打標籤。目前有兩種方式:

針對機器自動打標籤,需要採取機器學習的相關演算法來實現,即針對一系列給定的標籤,給內容選取其中匹配度最高的幾個標籤。這不同於通常的分類和聚類演算法。可以採取使用分詞 + word2vec來實現,過程如下:

使用者特徵化

使用者特徵化即為使用者打標籤。通過使用者的行為日誌和一定的模型演算法得到使用者的每個標籤的權重。

隱語義推薦

有了內容特徵和使用者特徵,可以使用隱語義模型進行推薦。這裡可以使用其簡化形式,以達到實時計算的目的。

使用者對於某乙個內容的興趣度(可以認為是ctr):

基於內容的電影推薦 使用者畫像

使用者畫像構建步驟 使用者畫像建立import pandas as pd import numpy as np from gensim.models import tfidfmodel from functools import reduce import collections from ppri...

基於內容和使用者畫像的個性化推薦

目前比較流行的個性化推薦演算法有以下幾種 本文所講述的基於內容和使用者畫像的個性化推薦屬於第一種。對於此種推薦,有兩個實體 內容和使用者,因此需要有乙個聯絡這兩者的東西,即為標籤。內容轉換為標籤即為內容特徵化,使用者則稱為使用者特徵化。對於此種推薦,主要分為以下幾個關鍵部分 綜合上面講述的各個部分即...

使用者畫像系統的技術架構和整體實現

這裡講解下使用者畫像的技術架構和整體實現,那麼就從資料整理 資料平台 面向應用三個方面來討論乙個架構的實現 個人見解 資料整理 1 資料指標的的梳理 於各個系統日常積累的日誌記錄系統,通過sqoop匯入hdfs,也可以用 來實現,比如spark的jdbc連線傳統資料庫進行資料的cache。還有一種方...