協同過濾 讀書筆記(未完成)

2021-10-06 21:47:57 字數 1315 閱讀 6301

對企業而言是解決『增長』問題,推薦系統處於『增長引擎』的位置

對使用者而言是解決資訊過載問題,在』資訊過載『的情況下如何獲得感興趣的資訊

推薦系統的基礎問題就是』人『和』資訊『的關係。

上述中的『人』,在實際過程中『人』也是各種資料。和人相關的資訊可以被稱為使用者資訊

除了使用者資訊和商品資訊,為了使推薦系統具有實時推薦的能力,基於使用者所處的時間,地點,狀態等一系列環境資訊也會對使用者選擇造成影響。統稱這類資訊為『場景資訊』或者『上下文資訊』

場景資訊和上述兩種資訊的差距在於場景資訊實時動態變化

協同過濾(cf)演算法族:

· ·協同過濾演算法從物品相似度使用者相似度出發,衍生出兩種模型itemcfusercf模型。為了使協同過濾擁有處理稀疏共現矩陣和更強的泛化能力,發展出了矩陣分解mf模型,並發展出矩陣分解的各個分支模型。

邏輯回歸模型族

因子分解機模型族

組合模型族

協同什麼?

協同使用者對物品的評價,反饋, 意見等資訊。

過濾什麼?

對海量資訊進行過濾。

cf具體問題?

**使用者x是否喜歡該商品a?

已知資訊儲存形式?

共現矩陣

共現矩陣?

user\item

item1

item2

item3

user1

+1-1

0user20+1

0user3-1?

+1usercf?(itemcf同理)

計算與user興趣相似的top(n)使用者,根據這些使用者計算出對目標商品的**值。(top(n)中的n為超引數)

如何計算使用者相似度?(p17)

a. 余弦相似度

b. 皮爾遜相關係數

c. 基於皮爾遜的係數引入物品平均分減少評分偏置方法

usercf的問題?

a. 需要維護使用者相似度矩陣,矩陣一般以n^2的速度隨使用者數增長

b. 使用者歷史資料往往稀疏,相似使用者準確度很低

協同過濾的問題?

處理稀疏向量的能力弱,頭部效應明顯(p20)

解決上述問題方法?

mf-矩陣分解

經典**

亞馬遜推薦系統:linden g , smith b , york j . amazon. com recommendations: item-to-item collaborative filtering[j]. ieee internet computing, 2003, 7(1):76-80.

《現代作業系統》第1章讀書筆記 引論(未完成)

現代計算機系統由乙個或多個處理器 主存 磁碟 印表機 鍵盤 滑鼠 顯示器 網路介面以及各種其他輸入 輸出裝置組成。一般而言,現代計算機系統是乙個複雜的系統。如果每位應用程式設計師都不得不掌握系統的所有細節,那就不可能再編寫 了。而且,管理這些部件並加以優化使用,是一件挑戰性極強的工作。所以,計算機安...

博弈論筆記 未完成

1 分析博弈 小紅是個遊戲迷,他和小藍一起玩拿石子遊戲。遊戲規則為2個人輪流拿石子。一次可以拿1顆或3顆,規定誰取到最後一顆石子誰就勝出。最後決定由小紅先取。兩人都是遊戲高手,該贏的絕不會輸 表示不會失誤 問在知道石子總數的情況下,怎樣快速 誰將會勝出。取石子分為3種情況 1,1 共取走2個石子 1...

軟體測試技術基礎 筆記(未完成)

軟體測試的目的即是盡可能發現軟體中的缺陷 軟體缺陷可以定義為軟體實現的遺漏 使用者需求實現遺漏 錯誤 與有使用者需求不符 多餘 額外的實現 80 的錯誤集中在20 的 中 經驗有理。1 測試分類 黑盒測試,不關注內部實現邏輯,把所有實現看成乙個黑盒子,只關注輸入和輸出,具體包括 功能測試 效能測試 ...