機器學習(10) 推薦系統

2021-09-12 12:24:11 字數 1539 閱讀 4444

估計這章內容後面來的概率也比較低吧,學到一點思想,但畢竟現在推薦系統作為企業超看重的部分,發展較好,這些內容是不夠的,太入門了

推薦系統能領悟特徵學習的思想,不需要手動建立特徵

未防止後面看不懂,這裡做個說明:nu表示 使用者數量,nm表示電影數量,r(i,j)=1表示使用者j看過電影i,y(i,j)表示使用者j給電影i的評分僅當r=1時

接下來說的θ和x都是向量:

基於內容的推薦演算法:假設電影種類分為兩種,用特徵x1,x2表示電影偏向哪一種型別,新增x0作為截距特徵。那麼每乙個電影就有乙個特徵向量x(i)。對每乙個使用者j學習乙個引數θ(通常是n+1維,n為特徵數量),θtxi就等於電影i的**評分。

演算法給出x來學習θ,形同於線性回歸,梯度下降。這種演算法較簡單,但是已知的是各個電影的特徵量,愛情部分佔比,動作佔比等。

同理,若x未知,但是θ已知,可以用θ來學習x

協同過濾,自行學習所要用的特徵。現假設已知使用者的特徵偏好θ。現在是給出θ來學習x,協同過濾就是θ->x->θ->x...的過程

為了簡化隨機θ,然後求x求θ再求x的過程,提出協同過濾演算法:x學習θ時是使用者對所有電影的評價,θ學習x時是一部電影所有使用者的評價,協同過濾兩者統一起來,是所有電影使用者有評價時的求和,最小化代價函式時即求令x和θ同時進行最小化

演算法:初始化所有x和θ值,然後梯度下降使代價函式最小化

簡單點說,協同過濾就是同時考慮x和θ,共同搭建函式

向量化-低秩矩陣分解:協同過濾的一種方法,將**得分分別用x和θ矩陣表示。

均值規範化:問題由來,如果乙個使用者對物品(如電影)未評分,最小化代價函式j時會使θ向量全為0則**時所有得分都為0,這樣不好。均值規範化作為協同過濾的預處理,減去均值,最後**評分時加上均值,這樣乙個從未評分的使用者的**就是平均值了

機器學習 推薦系統

在各類 軟體或各大購物 裡,通常會存在推薦系統。它可以根據每個使用者的個人喜好為使用者推薦相應的歌曲 商品 從而增加使用者體驗,並提高了產品的銷量。因此,推薦系統是乙個很值得學習的應用領域。如下圖所示,這是4個使用者對5部電影的評價,我們要求評價只能是0 5之間的數。可以看出,有一些已經打分了,有一...

機器學習2 推薦系統

問題 topk ctr步驟 feature recall 基於熱度,基於使用者興趣標籤,基於cf,基於fm sort lr,gbdt,gbdt lr,fm,dnn ad評價指標 accuracy 正確的樣本 總樣本 precision 為正類正確的樣本數 為正類的樣本數 recall 為正類正確的樣...

機器學習基礎7 推薦系統

近十年以來,推薦系統迅猛發展,比如說亞馬遜的商品推薦等.而netflix的比賽,讓推薦系統更廣為人知.資訊量 所帶來的影響非常深遠,衍生出了一種個性化思想,連線使用者和某一項事物.傳統的瀏覽模式成為歷史,我們必須尋找一種新的模式.推薦系統的例子 電影推薦 商品推薦 推薦 使用者關係判斷 比如微博上的...