第 2 章 推薦系統的核心技術概述

2022-06-17 14:12:14 字數 992 閱讀 1180

原文

全文目錄

多元件, 多模組, 多資料來源構成; 涉及使用者, 物品, 行為, 上下文等資料;

計算形式包括大資料平台上的批量計算/挖掘/訓練, 流式資料的實時處理, 線上的實時服務;

核心目的: 為使用者找當前場景下最具相關性的物品或物品集合;

以使用者興趣為軸:

\[p(item|user)=\sum_ (p(item|interest) × p(interest|user))

\]使用者與物品的相關性拆解為: 使用者與興趣的相關性和興趣與物品的相關性的乘積;

\(p(item|interest)\) 和 \(p(interest|user)\) 任何乙個為零, 乘積即為零;

使用者感興趣的點+興趣點下物品的相關性;

三段式邏輯:使用者興趣+相關性召回+融合排序

召回演算法=>重排序=>業務干預

召回演算法的關注點:

相關性核心, 重排和業務干預層均不會引入新的候選物品, 只有召回層決定了使用者可見物品的候選集; 如果召回相關性較差的物品, 不僅浪費計算力, 也增加了重排序層的工作負擔(需要用更複雜的演算法將相關性差的物品排在後面);

多樣性覆蓋率

實時性將使用者的實時行為用於推薦邏輯的計算, 對推薦結果產生影響, 並讓使用者感知到變化;

召回演算法分為:

相關性資料探勘, 依賴於:

使用者畫像建設工作的核心點:

判斷哪些使用者畫像對推薦系統或其他業務有幫助;(重要性高於第二點)

如何挖掘這些畫像;

物品畫像是使用者畫像的基礎, 首先提取物品層面的多維度描述, 再通過使用者對物品的行為關係, 計算出使用者在這些維度上的描述;

離線, 偏向於生產準確率高, 覆蓋率高的商品和使用者資料;

java核心技術 第3章 筆記

類名每個詞首字母大寫 變數 第二個詞首字母大寫 宣告乙個變數之後,必須使用賦值語句對該變數進行顯示的初始化,不能使用未初始化的變數 常量 全都用大寫字母表示 利用關鍵字final表示常量,關鍵字final表示的變數只能被賦值一次,賦值後不能進行更改 可以使用關鍵字static final表示乙個類常...

Java核心技術筆記 第5章

size large 1 動態繫結 size size medium 靜態繫結 private方法 static方法 final方法或者構造器 子類陣列的引用可以轉換成超類陣列的引用 在覆蓋方法時一定要保證返回型別的相容性,子類方法不能低於超類方法的可見性 在equals方法中,如果子類決定相等的概...

第2章 通訊系統概述

1 一句話 通訊的世界,過去是屬於模擬的,現在和將來是屬於數字的,但未來的未來必定還將是屬於模擬的。2 數碼訊號 vs 模擬訊號 模擬訊號 變化是平滑的 數碼訊號 離散值。可以對雜訊處理 成本低 可編碼 3 傅利葉級數 把看起來毫無規律用確定的程式表達 乙個非週期訊號可以看作週期無限長的週期訊號 4...