推薦系統綜述 只談感受不談理論

2021-06-23 02:15:27 字數 1846 閱讀 9483

1 推薦系統的概念

推薦系統是一類能夠向使用者推薦定製化資訊的系統的統稱。推薦系統的核心是「個性化」,所謂個性化就是指向使用者提供為其「量身定做」的資訊。當然,資訊本身是客觀存在的,推薦系統要做的只是將合適的資訊適時地推送給特定使用者。推薦系統的背景是「大資料」,目前幾乎所有的推薦系統處理的都是海量的「大資料」,大資料一方面提供給推薦系統足夠多的資訊作為推薦依據,一方面也向推薦系統提出了計算能力上的挑戰。推薦系統的本質是「**」,也就是說,推薦系統本質上還是根據使用者歷史資料**使用者未來的行為。

2 推薦系統的意義

推薦系統是人工智慧科學在現代社會的一類應用,是資訊文明發展到一定程度的自然產物。

一方面,資訊文明發展到今天,呈現出「資訊大**」的局面,在茫茫的資訊海洋中,任何資訊都只是滄海一粟,儘管它也許對於這個星球上的某些人而言具有特別的意義。但是在海量資訊面前,人們愁的不再是資訊匱乏,而是資訊太多,缺乏提取「有用」資訊的手段。事實上,在網際網路世界裡存在著大量「暗資訊」,這些資訊如果不經某種手段予以挖掘,很可能無人問津,儘管它們也許對某些人而言特別重要。

上世紀末湧現出的搜尋引擎技術是相當成功的,因為它在一定程度上緩解了上面提到的問題。但是它做得還遠遠不夠。首先,它不夠智慧型。搜尋引擎技術總是需要使用者提供關鍵字以進行被動搜尋,永遠無法主動挖掘使用者的需求並提供資訊服務。其次,也是更要命的,它完全沒有個性化。任何使用者只要提供的關鍵字一致,那麼搜尋結果必然也一致,不管搜尋發生在何時何地何種情景下。而智慧型化和個性化,恰恰是推薦技術較搜尋引擎技術高明的地方。所以說,推薦系統是人們在解決「資訊大**」問題上邁出的最新的一步,它左右著資訊時代人與資訊之間的關係。

另一方面,人工智慧科學發展到今天,趕上了大資料的浪潮。大資料帶來的統計學意義使得以統計學習方法為主導思想的機器學習和資料探勘技術如魚得水。推薦系統正是在這種背景下誕生出的乙個充滿活力的細分領域,它直接享用了所有這些技術儲備。而到目前為止推薦系統的成功,也給人們帶來了希望,人工智慧的春天還會遠嗎?

3 推薦系統的困境

不管怎麼說,推薦系統仍是乙個很年輕的領域,真正意義上的理論研究始於上世紀九十年代初,而真正成功的商用推薦系統可能也只是本世紀初的產物。推薦系統依然面臨諸多困境。

3.1 冷啟動問題

任何系統都會有個初始狀態,如何開始特別重要。這裡的「冷啟動問題」是指推薦系統在初始狀態時由於資料量稀疏,可能難以有效提供個性化推薦服務。打個比方,乙個剛認識的朋友,由於對他缺乏足夠了解,你將很難為他推薦一部電影或一本書,而我們對乙個人的了解一般而言正是基於對這個人歷史行為的觀察。推薦系統也是如此,由於對乙個新加入系統的使用者缺乏足夠觀察,它將很難向該使用者提供令人滿意的個性化推薦服務。

3.2 準確性

-多樣性問題

衡量乙個推薦是否成功,我們會比較關心它推薦的準確率,比如十次推薦有幾次是使用者真正接受的。但是如果有人總是向你推薦那些你顯然會喜歡的東西,比如最最熱門的**,那麼這個推薦存在的必要性將大打折扣,因為即便沒有這個推薦,你同樣能輕鬆獲得相關資訊。作為乙個享受推薦服務的人,你更需要的可能是那些比較準確,同時又能推薦一些不那麼流行、有點小眾、不借助特殊渠道可能無法及時獲得相關資訊的推薦,比如說一篇很符合你的口味卻又不那麼出名,你自己找估計還找不到的散文。一般而言,追求準確性,將喪失一部分多樣性;反之,追求多樣性,將犧牲一部分準確性。這之間的權衡,是推薦系統面臨的大問題。

3.3 多維資料交叉利用

4 推薦系統展望

儘管目前的推薦系統大多研究最簡單的使用者-

物品關係網路,本質是**使用者將來是否會與某一物品發生行為關係。但是泛化來看,**使用者行為是一件很了不起的事,它將使人類歷史上第一次獲得一種**人類自身未來行為的有效機制,這項技術勢必將滲透入人類社會生活的方方面面,而不僅僅是目前所見的網際網路世界,儘管這已經是乙個相當龐大的時空。另一方面,在推薦系統研究和應用過程中誕生出的種種思想和技術也將被提取並保留下來,在人工智慧的其他領域繼續發光發熱。

推薦系統綜述

uir rui 是使用者u對物品i的實際評分,而r u i hat r ui 是推薦系統給出的 評分,則rmse定義為 mae定義為 topn推薦 此方法一般不考慮評分,而是為使用者提供乙個個性化推薦列表,通過 使用者對物品的興趣度對列表進行排序,選取其中前n個物品推薦給使用者,通常用於電子商務 社...

推薦系統的探索與利用問題綜述

目標與建模 所以我們的目標就是在有限的n次選擇中盡量使得累計遺憾最低 text r sum w w textr t text w textw text text r t sum 0 text upper confidence bound,即置信區間上界 置信區間可以簡單直觀地理解為不確定性的程度,區...

談矩陣分解在推薦系統中的應用

為了方便介紹,假設推薦系統中有使用者集合有6個使用者,即u 專案 物品 集合有7個專案,即v 使用者對專案的評分結合為r,使用者對專案的評分範圍是 0,5 r具體表示如下 矩陣分解演算法的數學理論基礎是矩陣的行列變換。在 線性代數 中,我們知道矩陣a進行行變換相當於a左乘乙個矩陣,矩陣a進行列變換等...