11 推薦系統

使用者分析

新使用者：傾向於瀏覽熱門商品

老使用者：逐漸開始瀏覽冷門商品

新穎度覆蓋度

離線實驗

使用者調查：

新演算法最終上線條件

基尼係數

覆蓋度：

itemcf演算法的**結果比usercf略高

itemcf可以額預先算好個個物品的相似度，**速度快

如果物品的變更速度快，武平縣速度的矩陣頻繁更新需要的代價太大，使用usercf，如新聞**

冷啟動三類問題：

使用者冷啟動（新增的使用者，沒有使用者歷史資料）

物品冷啟動（新增的物品）

系統冷啟動（前兩者結合）

標籤種類

標籤推薦

p (u

,i)=

∑bnu

,b×n

bp(u,i) = \sum_\times

p(u,i)

=b∑

nu,

b×n

i,bb−

標籤

b−標籤 nu,

b−使用者

u打過標

籤b的數

量nu

−使用者u

打過標籤

b的數量

n i,

b−物品

i被打過

標籤b的

數量

ni,b

−物品i

被打過標

籤b的數

量演算法缺陷p(u

,i)=

∑bnu

log⁡(1

+nb,

u)×n

bp(u,i) = \sum_\frac})}\times

p(u,i)

=b∑

log(1+

nb,

u)n

u,b

×n

i,bnb

,u−標

籤b被多

少不同用

戶使用過

nb,u

−標籤b

被多少不

同使用者使

用過通過上面的公式就可以對熱門標籤進行懲罰。其中分子表示的使用者u的常用標籤，分母的log部分表示的該標籤在其他使用者的使用情況。也就是該標籤的流行度，如果該標籤流行度比較大，該標籤的總體計算就會權重減低。

同樣的思想我們可以對熱門物品進行懲罰：

p (u

,i)=

∑bnu

log⁡(1

+nb,

u)×n

blog⁡(

1+nb

)p(u,i) = \sum_\frac})}\times \frac})}

p(u,i)

=b∑

log(1+

nb,

u)n

u,b

×log(1

+nb

,i)

ni,

n b,

i−物品

i被多少

不同使用者

打過標籤

nb,i

−物品i

被多少不

同使用者打

過標籤

實現思路

找到使用者使用過的標籤和使用的次數

找到這些標籤被多少使用者使用過

找到被打過這些標籤的電影

找到這些電影被多少個不同使用者打過標籤

得到使用者u對這些電影的興趣結果

對興趣值做倒敘排列，取得使用者感興趣的電影

機器學習演算法 11 推薦系統實戰

from numpy import from numpy import linalg as la 載入資料使用者菜餚矩陣行為使用者,列為希餚,表示使用者對某個菜餚的評分 def loadexdata2 return 0,0,0,0,0,4,0,0,0,0,5 0,0,0,3,0,4,0,0,...

11 推薦系統

推薦系統11 《推薦系統實踐》總結

機器學習演算法 11 推薦系統實戰

推薦系統架構推薦系統（1）業界推薦系統架構

11 推薦系統

推薦系統11 《推薦系統實踐》總結

機器學習演算法 11 推薦系統實戰

推薦系統架構 推薦系統（1） 業界推薦系統架構

相關推薦

推薦系統架構推薦系統（1）業界推薦系統架構