推薦系統入門學習筆記(一)

2021-07-02 06:33:44 字數 2111 閱讀 1444

前言:由於最近需要寫一篇綜述性的**,加上對推薦系統比較感興趣,所以找了本《推薦系統》看看,作者是奧地利的學者詹尼士,贊克,弗里德里克等人。看到封皮上很多牛人的推薦語,頓時覺著如獲至寶。這個筆記記錄的也就是看這本書的總結和感想,主要目的是方便自己以後查閱和回憶。若是偶然有人能從筆記裡有所收穫,那真是不勝欣慰。這個筆記我讀書讀到**就記到**,內容時多時少,格式可能也比較自由。

1. 推薦系統的產生背景

2. 推薦系統是什麼東西

推薦系統就是個軟體系統,軟體的核心是推薦策略(演算法),它根據使用者的一些上網習慣或者偏好來為使用者提供個性化的內容和產品推薦。一般來說推薦系統有兩個目的:一方面,推薦系統被用於激發使用者去做某件事情,比如購買一本書或觀賞一部電影;另一方面,推薦系統也可以被看做是解決資訊過載的工具,因為系統的目標是從大集合裡選擇最感興趣的物品。提供個性化推薦要求系統知道每個使用者的資訊,推薦系統必須開發並維護乙個使用者模型(user model)或使用者記錄(user profile)儲存使用者的偏好。

3. 推薦策略之協同過濾(cf: collaboration filtering)推薦

核心思想:如果使用者在過去有相同的偏好(比如他們買過相同的書),那麼他們在未來也會有相似的偏好。舉例來說,如果使用者a和使用者b先前都買過很多相同的書,而且使用者a最近買了一本使用者b還不知道的書,那麼這時基本的邏輯就是像b推薦這本書。由於這是隱式地與他人相互協作從大量集合中過濾最有希望買的書,因此叫做協同過濾。

需要考慮的問題(我認為這個是重點):

a. 如何發現與我們要推薦的使用者有著相似偏好的使用者?

b. 如何度量相似度?(這個可能要看看資料探勘的書)

c. 如何處理還沒有購買經歷的新使用者?

d. 如果只有很少的評分該怎麼辦?

e. 除了利用相似的使用者之外,還有哪些技術可以用來**某個使用者是否喜歡其物品?

純粹的協同過濾方法不會利用或要求任何有關物品本身的知識,而是基於相似使用者的選擇來推薦。

4. 推薦策略之基於內容的推薦

當然,基於內容推薦的核心是能夠得到物品的描述(不管你是人工生成還是自動抽取)和這些特徵的重要記錄。同樣,使用者記錄也需要自動抽取或「學習」,方法是分析使用者的行為和反饋,或者直接詢問使用者的興趣和偏好。

需要考慮的問題(這種問題都是重點,可以指導學習的思路):

a. 系統如何自動獲取並持續改進使用者記錄?

b. 如何決定哪個物品匹配或者至少能接近、符合使用者的興趣?(這個問題是不是可以這樣描述:如何發現度量物品的特徵和使用者的偏好的相似度?這樣一說,是不是和協同過濾的a和b比較像)

c. 什麼技術能自動抽取或學習物品的描述,從而減少人工標註?

5. 推薦策略之基於知識的推薦

a. 那種領域知識能表示成知識庫?

b. 什麼機制可根據使用者的特點來選擇和排名物品?

c. 如何在沒有購買記錄的領域獲取使用者資訊(這個類似如何處理新使用者的問題)?如何處理使用者直接給出的偏好資訊?

d. 哪種互動方式能夠用於互動式推薦系統?(使用者易於接受的互動,不會覺得很浪費時間)

e. 設計對話時,要考慮那些個性化因素才能確保準確獲得使用者偏好資訊?(這個需要專業人士來進行設計互動問題)

說實話,我覺著基於知識的推薦與基於物品的推薦有那麼一些相似,可能是我還沒理解……

6. 推薦策略之混合推薦方法

前面提到能不能把協同過濾和基於內容的推薦組合使用,答案是可以的,這就是混合推薦。由於問題背景的不同,目前討論的方法各有優、缺點。組合各種不同技術產生更好或更精確的推薦。但是,問題來了……

a. 哪種方法能被組合,特定組合的前提是什麼?

b. 兩個或多個推薦演算法是應該順序計算,還是採用其他混合方式?

c. 不同方法的結果如何賦以權重,可以動態決定嗎?

7. 評估推薦系統

推薦系統領域研究的主要推動力是提高推薦質量。那麼,如何去衡量乙個推薦系統的推薦質量呢?這個問題現在我也不理解,先記下來……

後記:這是我讀第一章前言所記錄的,由於是第一次寫東西,加上才疏又學淺,難免有錯誤或不當的地方,望各位多多批評指正

《推薦系統實踐》學習筆記(一)

第一章 好的推薦系統 2.長尾理論 80 20原則 3.社會化推薦 social recommendation 好友給自己推薦物品 基於內容的推薦 content based filtering 和以前物品相似的物品 基於協同過濾的推薦 collabrative filtering 和自己歷史興趣相...

推薦系統01推薦系統入門

這裡給出了三個主要原因 網際網路規模增長迅速,資料量資訊過載,人們很難獲得有效資訊 資料太多了,我看不過來 搜尋引擎的方式只能滿足有確切主題 知道如何描述的資訊,沒有辦法搜尋自己模糊不清的需求 人們需要個性化服務來減少不必要的工作。在這樣的背景下,推薦系統應運而生,推薦系統究竟實現了怎樣的工作,實際...

推薦系統入門

因為找工作需要,在這裡記錄一下學習推薦系統的過程。希望能上岸,上岸後必傾盡所學進行更加細緻全面的分享。機器學習 深度學習 立根之本,但是略 月度計畫 1月 1.14 2月 2.1 追蹤閱讀相關 3月 3.1 差缺補漏,特徵工程,通過以往競賽學習 1月 計畫第一周 1.13 19 特徵分解 pca s...