推薦領域資料集

2022-07-29 03:30:18 字數 1183 閱讀 8662

movielens dataset

其中movielens-100k和movielens-1m有使用者對電影的打分,電影的title、genre、imdb鏈結、使用者的gender、age、occupation、zip code。movielens-10m中還有使用者對電影使用的tag資訊。

hetrec2011 dataset:包括了movielens-2k、delicious-2k和last.fm-2k。

在movielens-2k中,電影的資訊更加豐富了,有imdb和rotten tomatoes的資訊,具體還有電影對應的genre、director、actor、發行的國家、拍攝的地點、tag資訊,當然還有打分資訊。

在delicious-2k中,是使用者對bookmark(書籤)的tag資訊。具體包括使用者之間的relation、書籤的title和url、使用者對書籤使用的tag。這個資料集適用於tag的推薦。

在last.fm-2k中,是使用者收聽**的資訊。具體包括雙向的朋友關係、藝術家、使用者收聽藝術家資訊(有weight)、使用者對藝術家的tag資訊、藝術家tag資訊。

wikilens dataset

bookcrossing dataset:使用者對書的打分資訊,使用者城市、使用者年齡、書在amazon的資訊及url。

jest joker dataset

eachmovie dataset

(下圖摘自**recommender system survey)

flixster dataset:使用者對電影的打分以及使用者的friendship資訊。

yelp dataset:

bibsonomy dataset: 與delicious類似。

foursquare dataset:location-based 推薦。

epinions and ciao dataset

另外還有一些社交網路分析的資料集

推薦演算法python資料集 推薦演算法資料集

movies recommendation movielens 基本內容 movielens資料集由grouplens研究組在 university of minnesota 明尼蘇達大學 與我們使用資料集無關 中組織的。movielens是電影評分的集合,有各種大小。資料集命名為1m,10m和20...

推薦系統資料集

movielens dataset 其中movielens 100k和movielens 1m有使用者對電影的打分,電影的title genre imdb鏈結 使用者的gender age occupation zip code。movielens 10m中還有使用者對電影使用的tag資訊。hetr...

推薦系統常用資料集

ps 對原文有所刪減 在這篇部落格中,作者介紹了九個資料集,其中一些是推薦系統中常用到的標準資料集,也有一些是非傳統意義上的資料集 non traditional datasets 作者相信,這些非傳統資料集更接近真實場景的資料。movielens資料集由grouplens研究組在 universi...