關於推薦系統

2021-08-27 15:03:26 字數 1208 閱讀 9670

推薦系統實踐和系統接觸了一些,偶然讀到百分點推薦系統設計一文,有些感想總結如下:

1.推薦的行業差異性

a)行業共有的:實時性,高可用性等主要體現在架構上

b)差異性主要體現在推薦的內容上:有的購買重複性高,具有週期性,有的產品就不能重複購買,例如相同款式的包包等,這裡需要對行業進行細分,這個差異主要區別在特徵上,時間特性,內容特性等。例如在不同的時間如節假日相關的物品,話題。

2.推薦的領域

a)基於全網的,主要在搜尋,側重內容,難點在理解使用者的準確需求

b)垂直類的,相對來說特定某乙個領域或者行業,對使用者的興趣和物品的特徵需要有較清晰的把握。

c)現在垂直類的不限於利用使用者在本站產生的行為,需要全網或者其它站點提供使用者的資訊,比如使用者的搜尋,看的內容,廣告等,大部分利用cookie的傳遞,這需要不同站點協作。基於全網的分析可以給推薦系統對全域性熱點話題,興趣的把握。

d)全網合作性的加強,未來網際網路是乙個雲,每乙個**都是雲的一種服務,它們協作起來為使用者提供更好的服務。可以聯絡到現在的商品內容的關聯分析,特別是垂直類的發展,未來一項服務可能需要多個**共同完成,現在的adexchange;很多類似的服務有往這發展的趨勢,**服務之間的耦合是個問題,但從個人觀點看,應該很容易解決。

3.架構的設計方面

1)資料採集和分析

資料我覺得可以分為全網和垂直類的,不管是哪一種,資料量都是非常大,需要採用高效的分布式儲存架構,按照內容的不同採用不同的儲存架構。在這個階段資料採集之後需要對之進行分析包括建立索引,抽取特徵,找出熱點等資訊。按照user,item進行特徵的挖掘和提取。實時性在這部分主要是新資料的採集,使用者行行為的產生等能夠及時的反饋到推薦引擎

2)各種推薦引擎

a)這部分主要利用1的資料進行各種推薦演算法,需要輸入,輸出足夠抽象,方便擴充套件。

b)這部分訓練的模型和權重要滿足高效能的查詢和更新。方便實時的更新**模型,可以使用各種實時計算各種來實時的更新。

3)推薦伺服器

這部分主要滿足推薦服務請求和重排序等功能。

4)測試和迭代

主要是方便測試和加速迭代

系統架構我覺得主要要滿足健壯性,服務要能承受很高的併發,出錯少,方便測試和回歸。其次,可擴充套件性,資料量大,無論是資料還是模型的儲存,更新,查詢都需要實現快速的部署和恢復。

以上的架構需要更多思考,因為知識所限,偏頗之處在以後會做更新!

推薦系統架構 推薦系統(1) 業界推薦系統架構

1.1業界主流推薦系統架構 業界推薦系統通用架構 1.2使用者本身資料 1.3物品本身資料 1.4使用者行為資料 2.1基於離線訓練的推薦系統架構設計 常用演算法 邏輯回歸 logistics regression 梯度提公升決策樹 gbdt 和因式分解 fm 架構設計 2.2面向深度學習的推薦系統...

推薦系統(1) 推薦系統概述

推薦系統是主動從大量資訊中找到使用者可能感興趣的資訊的工具。推薦系統的核心問題是如何實現推薦個性化 如何向使用者推薦匹配度高的產品 商品 或專案,本質是通過一定的方式將使用者和專案聯絡起來。自從xerox palo alto研究中心於1992年研發出了基於協同過濾的實驗系統tapestry以來 主要...

推薦系統01推薦系統入門

這裡給出了三個主要原因 網際網路規模增長迅速,資料量資訊過載,人們很難獲得有效資訊 資料太多了,我看不過來 搜尋引擎的方式只能滿足有確切主題 知道如何描述的資訊,沒有辦法搜尋自己模糊不清的需求 人們需要個性化服務來減少不必要的工作。在這樣的背景下,推薦系統應運而生,推薦系統究竟實現了怎樣的工作,實際...