推薦系統實踐

實驗方法

測評指標：

測評維度：

使用者活躍度和物品流行度：長尾分布

一般來說，不活躍的使用者要麼是新使用者，要麼是只來過**一兩次的老使用者。那麼，不同活躍度的使用者喜歡的物品的流行度是否有差別？一般認為，新使用者傾向於瀏覽熱門的物品，因為他們對**還不熟悉，只能點選首頁的熱門物品，而老使用者會逐漸開始瀏覽冷門的物品。

使用者行為資料設計的推薦演算法

其中最主要的方法為基於鄰域的演算法：

基於使用者的協同過濾演算法：

改進 1：

如果對使用者兩兩計算相似度，複雜度過高o(n*n) ，因此可以首先計算item-user的倒排表，然後計算使用者相似度，這樣可以過濾掉共同物品為0的使用者

改進 2：

考慮物品本身的流行度，

基於物品的協同過濾演算法

改進 1 ：user-item倒排表

改進 2 使用者活躍度的影響

隱語義模型是最近幾年推薦系統領域最為熱門的研究話題，它的核心思想是通過隱含特徵(latent factor)聯絡使用者興趣和物品。

隱含語義分析技術從誕生到今天產生了很多著名的模型和方法，其中和該技術相關且耳熟能詳的名詞有plsa、lda、隱含類別模型（latent class model）、隱含主題模型（latent topic model）、矩陣分解（matrix factorization）。這些技術和方法在本質上是相通的，其中很多方法都可以用於個性化推薦系統。

隱性反饋資料中，沒有負樣本只有正樣本；在隱性反饋資料集上應用lfm解決topn推薦的第乙個關鍵問題就是如何給每個使用者生成負樣本。

對於第一種方法，它的明顯缺點是負樣本太多，正負樣本數目相差懸殊，因而計算複雜度很高，最終結果的精度也很差。對於另外3種方法，rong pan在文章中表示第三種好於第二種，而第二種好於第四種。

lfm和基於鄰域的方法的比較

利用使用者註冊資訊

選擇合適的物品啟動使用者的興趣

一般來說，能夠用來啟動使用者興趣的物品需要具有以下特點

利用物品的內容資訊

發揮專家的作用

使用者用標籤來描述對物品的看法，因此標籤是聯絡使用者和物品的紐帶，也是反應使用者興趣的重要資料來源，如何利用使用者的標籤資料提高個性化推薦結果的質量是推薦系統研究的重要課題

資料稀疏性

對於新的物品或者使用者，標籤數量非常少，此時需要對標籤進行擴充套件 ---基於標籤的相似性

標籤清理：除去詞頻很高的停止詞、同義詞等；模擬自然語言處理

時間上下文資訊

系統時間特性的分析:

時間上下文相關的usercf演算法

地點上下文

什麼是推薦系統？推薦系統實踐筆記1

隨著資訊科技 information technology 和網際網路 internet 的發展，人們逐漸從資訊匱乏的時代走向資訊過載的時代。對於內容生產者來說，需要思考的問題是如何使生產的資訊受到使用者的大量關注對於使用者來說，如何快速找到自己所需要的資訊是很重要的。因此，有效連線內容生產者和使...

推薦系統實踐

推薦系統實踐好的推薦系統

推薦系統11 《推薦系統實踐》總結

什麼是推薦系統？推薦系統實踐筆記1

推薦系統實踐

推薦系統實踐 好的推薦系統

推薦系統11 《推薦系統實踐》總結

什麼是推薦系統？ 推薦系統實踐筆記1

相關推薦

推薦系統實踐好的推薦系統

什麼是推薦系統？推薦系統實踐筆記1