推薦系統常用資料集

2022-08-29 07:33:10 字數 1308 閱讀 2678

book

· 1. book crossing

bookcrossing(bx)資料集由cai-nicolas花了的4周(2023年8月/ 9月)從book-crossing社群中爬取得到的。

電子商務

· 2. amazon

· 3. retailrocket推薦系統資料集

該資料集由三個檔案組成:乙個行為資料集(events.csv),乙個屬性資料集(item_properties.сsv)和乙個類目樹資料集(category_tree.сsv)。該資料來自現實世界的電子商務**。

**· 4. amazon music

· 5. yahoo music

該資料集是乙個快照,收集了**社群對各種**藝術家的偏好。

· 6. lastfm(implicit)

該資料集收集了last.fm**上2千名使用者的社交網路、tagging和music artist listening資訊。

· 7. milion song dataset

million song資料集是乙個免費的資料集,提供了一百萬條當代流行**曲目相關的的audio features和metadata。

電影· 8. movielens

· 9. yahoo movies

該資料集包含從兩個不同**收集的歌曲的rating資料集。第乙個**是使用者在與yahoo上使用**服務是產生的rating資料。

· 10. ciao***

ciao***是2023年12月從**上抓取的***類別資料集。

·11. filmtrust

filmtrust是2023年6月從整個filmtrust**上抓取的乙個小型資料集。

· 12. netflix

這是netflix獎競賽中使用的官方資料集。

遊戲· 13. steam video games

jokes

· 14. jester

該笑話資料集包含來自73,496個使用者,關於100個笑話的410萬連續rating資料(-10.00到+10.00)

餐飲·15. chicago entree

該資料集包含使用者與entree chicago餐廳推薦系統互動的記錄資料。

動漫·16. 動漫推薦資料庫

該資料集包含來自12,294個動漫的73,516個使用者的使用者偏好資料。每個使用者都可以將動畫新增到已完成的列表中並為其評分,該資料集把這些評級整理起來。

其他資料集

· grouplens資料集

· librec資料集

· yahoo research資料集

· 斯坦福大型網路資料集彙編

推薦系統常用資料集

ps 對原文有所刪減 在這篇部落格中,作者介紹了九個資料集,其中一些是推薦系統中常用到的標準資料集,也有一些是非傳統意義上的資料集 non traditional datasets 作者相信,這些非傳統資料集更接近真實場景的資料。movielens資料集由grouplens研究組在 universi...

推薦系統資料集

movielens dataset 其中movielens 100k和movielens 1m有使用者對電影的打分,電影的title genre imdb鏈結 使用者的gender age occupation zip code。movielens 10m中還有使用者對電影使用的tag資訊。hetr...

MovieLens推薦系統資料集官方文件 解釋

grouplens research已從movielens 收集並提供評級資料集。根據集合的大小,在不同的時間段收集資料集。在使用這些資料集之前,請檢視其readme檔案以獲取使用許可證和其他詳細資訊。幫助我們的研究實驗室 請對movielens資料集進行簡短的調查 穩定的基準資料集。138,000...