推薦系統系列3 推薦系統中如何解決冷啟動

使用者冷啟動主要解決如何給乙個新的使用者做個性化推薦。當乙個新使用者（新註冊的）到來時，我們沒有他的歷史行為資料，所以無法根據他的歷史行為去**他的興趣，從而無法去做個性化推薦。

物品冷啟動

物品冷啟動主要解決如何將新的物品推薦給可能對其感興趣的使用者。

系統冷啟動

利用使用者註冊提供的年齡性別等做粗粒度的個性化推薦。

要求使用者在登入的時候對一些物品的反饋，收集使用者對這些物品的興趣資訊，然後給使用者做推薦。

對於新物品，可以利用物品的內容資訊，將它們推薦給喜歡過和該物品相似物品的使用者。

使用者的註冊資訊可以分三種：

（1）獲取使用者的註冊資訊

（2）根據使用者的註冊資訊對使用者分類

（3）給使用者推薦他所屬分類中使用者喜歡的物品

舉例說明：假設乙個新使用者註冊，首先獲取他的使用者資訊，比如他是乙個24歲的男性，是乙個研二學生。然後查詢三張離線計算好的相關表：性別-電影相關表，年齡-電影相關表，職業-電影相關表，從這三張表中查詢出所有的電影然後按照一定的權重相加，給使用者返回推薦列表。

（實際應用中還可以考慮組合特徵）。

選擇合適的物品啟動使用者的興趣

解決使用者冷啟動問題的另乙個方法是在新使用者第一次訪問推薦系統時，不立即給使用者展示推薦結果，而是給使用者提供一些物品，讓使用者反饋他們對這些物品的興趣，然後根據這些使用者反饋給使用者提供個性化推薦。很多的推薦系統採取了這種方式來解決使用者冷啟動問題。

對於這些通過使用者給物品的反饋來收集使用者興趣，從而對使用者進行推薦，他們需要解決的首要問題就是如何選擇物品讓使用者進行反饋。（一般這種情況下，會影響使用者的體驗感）

一般來說，能夠用來啟動使用者興趣的物品需要具有以下特點：

（1）比較熱門：如果要讓使用者對乙個物品反饋，前提是使用者知道這個物品時什麼？以電影為例，如果一開始讓使用者進行反饋的電影都很冷門，而使用者不知道這些電影的情節和內容，也就無法對它們做出準確的反饋。

（2）具有代表性和區分性：啟動使用者興趣的物品不能是大眾化或者流行度很高的，因為這樣的物品對使用者沒有區分性。比如，有一部電影票房很高很受大家歡迎，這樣的電影幾乎所有的使用者都會喜歡，因而無法區分使用者的興趣。

（3）啟動物品集合需要多樣性：在冷啟動時，我們不知道使用者的興趣，而使用者的興趣和廣泛，可能非常多，為了匹配多樣的興趣，我們需要提供具有很高的覆蓋率的啟動物品集合。

利用物品的內容資訊

物品冷啟動需要解決的問題是如何將新加入的物品推薦給對它感興趣的使用者。物品冷啟動在新聞**等時效性很強的**中非常重要，因為那些**中時時刻刻都有新加入的物品，而且每個物品必須能夠在第一時間展現給使用者，否則一段時間後物品的價值就大大降低了。

在前篇部落格中提到兩種推薦演算法，usercf和itemcf。實際上，usercf對物品冷啟動問題不是非常敏感。usercf在給使用者推薦時，會首先找到和使用者興趣相似的一群使用者，然後給使用者推薦這一群使用者喜歡的物品。所以，當乙個新物品加入時，總會有一些使用者通過某種途徑看到過新物品。

常見的物品資訊：物品的內容資訊多重多樣，不同型別的物品也會有不同的內容資訊。例如電影，內容資訊一般有標題、導演、演員、國家、年代、還有電影介紹等；例如圖書，內容資訊一般包括標題、作者、出版社等。