王守昆 搜尋 計算廣告 個性化推薦趨於融合

2021-09-16 18:23:15 字數 2939 閱讀 8796

在電商、網際網路廣告、移動網際網路,推薦系統發揮著越來越大的價值。豆瓣是國內較早涉及推薦演算法和推薦系統的公司,在國內技術圈,豆瓣還有明顯的工程師驅動的風格。在qcon北京2014大會上,豆瓣首席科學家王守昆將分享《大資料環境下社交圖譜和興趣圖譜的融合》的話題。日前,infoq對王守昆進行了專訪,以下為採訪內容:

\u0026#xd;\n

infoq:王守昆你好,首先做個自我介紹吧。

\u0026#xd;\n

王守昆:我在2023年加入豆瓣,8年來一直從事個性化推薦技術、資料探勘等網際網路演算法相關的工作。在此之前,我做過**鏈優化建模、管理諮詢,以及專案管理等工作。

\u0026#xd;\n

王守昆:過去幾年來,乙個明顯的趨勢是搜尋、計算廣告,以及個性化推薦這三者在底層模型和技術工具上越來越趨於融合。各種機器學習演算法作為這三者的基礎起到了至關重要的作用。運用各種成熟的機器學習方法來改善推薦質量,提公升使用者體驗已經是從業者必備的技能之一。此外,移動網際網路的蓬勃發展為個性化推薦提供了更加廣闊的前景和想象空間,相比於pc網際網路,使用者使用場景和習慣的改變使得使用者行為模型在個性化推薦領域的重要性獲得了空前提公升。個性化推薦不再單單侷限於興趣領域,興趣、關係、場景、行為模式,這四者都會起到至關重要的作用。在技術上,個性化推薦也促進了很多機器學習演算法並行化的發展,新的並行正規化、新的資料儲存方式層出不窮。可以毫不誇張的說,當前是個性化推薦領域飛速前進的時代。

\u0026#xd;\n

infoq:社交圖譜和興趣圖譜的建立,強烈依賴於使用者是否想在這個平台上展示自己。想展示自己的使用者的數量是有限的,那麼怎麼挖掘出那些使用者活躍度不是很高的使用者的興趣圖譜呢?即怎麼解決資料的稀疏性的問題。

\u0026#xd;\n

王守昆:資料稀疏性或冷啟動問題的確是個性化推薦領域的經典問題之一。改進推薦演算法,提公升精準度在這個問題上有一定幫助,但是坦白的說,獲取啟動資料的關鍵更多的在產品和運營,尤其在產品初創階段,演算法能夠起到的幫助比較有限。也就是說,關鍵在於產品的功能能否滿足使用者的需求,能否激發使用者的分享和傳播,從而使內容和資料的增長進入乙個良性迴圈的軌道。當然,我們可以用一些隱式模型或降維的方法來預先處理資料,緩解稀疏性的問題,當更加主要的,還是要看產品的方向。

\u0026#xd;\n

infoq:解決人與人、人與物的關聯形成的圖分析,目前有哪些比較好的開源計算框架?豆瓣現在使用了什麼樣的架構?這個架構能夠分析什麼樣的數量級的資料?

\u0026#xd;\n

王守昆:圖計算也是引人矚目的領域之一,利用圖的特殊性進行資料儲存和並行化計算,非常適合進行以鏈結和關係為基礎的資料分析和相關的機器學習演算法。比如graphlab、graphdb、graphsql、neo4j等等都是大家使用比較多的工具。

\u0026#xd;\n

infoq:興趣圖譜表明的是使用者的興趣的問題,如何把這個興趣商業化呢?在購買交易等行為中,使用者往往會綜合考慮興趣、**、位置等多方面的因素,也就是如何把興趣圖譜應用到電子商務的商品推薦上呢?

\u0026#xd;\n

王守昆:廣義來看,興趣是人們很多行為的持久驅動力之一。因此,從這個意義上講,由興趣而派生的商業行為和商業模式也會有持久的生命力。至於興趣圖譜在電子商務中的應用,很多電子商務的個性化推薦從業者都做的非常好,在這方面他們比我更有經驗。

\u0026#xd;\n

infoq:社交關係往往是社交網路才具有這樣的資料,而對於其他企業(特別是電商)如何利用這些社交關係創造利潤呢?也就是社交網路公司怎麼才能把自己的資料的價值變現呢?

\u0026#xd;\n

王守昆:社交關係會作為基礎設施而存在,事實上我們在一些大的社交平台上已經可以很清楚的看到這一趨勢了,這是正在發生的事情。各種應用,無論是電商、工具還是遊戲,都可以社交關係這一基礎設施中獲得更好的傳播和流量輸入,從而獲取更多利潤。擁有大規模社交關係的公司一定是平台級的公司,他們變現的方式多種多樣,有很大的想象空間。在這一過程中,個性化推薦可以幫助各方更有效的分配資源、提公升利用率。

\u0026#xd;\n

王守昆:主要還是分享我們在興趣圖譜和社交圖譜融合方面的一些經驗和教訓,以及對使用者行為模式的一些理解和發現。

\u0026#xd;\n

infoq:豆瓣的興趣圖譜與國外的pinterest等有何異同?社交圖譜是只來自於豆瓣本身,還是會考慮其他的社會關係(如微博)?

\u0026#xd;\n

王守昆:我們力圖建立乙個能夠涵蓋使用者的各種興趣的體系,並以此和社交圖譜為基礎串聯起整個使用者體系和使用者在**上的各種行為。社交圖譜主要來自於豆瓣本身,在得到使用者授權的情況下,我們也會考慮使用使用者其他的社會關係。

\u0026#xd;\n

infoq:除了這兩種圖譜,現在很多人還在說知識圖譜,這個有沒有可能與其他兩種圖譜結合?

\u0026#xd;\n

王守昆:如果我們說的是knowledge graph,那是google對搜尋未來的一種判斷和期待。背後是google整合人類所有資訊和知識的努力,是語義網、認知科學和人工智慧長久以來的積累和發展。這會是未來我們值得期待的突破之一,但目前對它的各種實用性要求,還為時尚早。

\u0026#xd;\n

此專題詳細資訊,請見專題頁面。關於此次qcon北京其他專題的詳細資訊,請移步至大會官網。

\u0026#xd;\n

需要特別註明的是,每年qcon大會門票都會在開幕前售罄,及早預定可提前確保席位,並享受更低折扣。3月26日前報名參加可享受9折優惠。團體購票(5人及以上)將享有更多優惠。詳請諮詢qcon【at】cn.infoq.com,或直接致電010-64738142。報名報名頁面。

搜尋,計算幾何 JZOJ 4016 圈地為王

在 n 行 m 列的網格中,你要圈一些地。你從左上角出發,最後返回左上角,路徑內部的區域視為被你圈住。你不可以進入網格內部,只能在邊上行走。你的路徑不能在左上角以外自交,但是邊足夠寬,你可以重複經過而不自交。網格中有一些格仔對你很重要,你要盡量圈住它 而另一些格仔對你有壞處,你不能圈住它。求圈住 i...

陽明先生固天縱英才矣《王陽明全集》作者 王守仁

本社 王陽明全集 以浙江圖書館藏明隆慶六年謝廷傑刻王文成公全書三十八卷本為底本標點,以四庫全書文淵閣本 四部備要本 國學基本叢書本 中華圖書館本及台灣 日本出版的王陽明全集本為參校本,原本誤漏或與諸本有異者,酌出校勘記。全集為四十一卷,卷一至三十一下為陽明本人著述 卷三十二至三十八為附錄 卷三十二為...

馬雲出新歌了!與王菲合作《功守道》主題曲《風清揚》

程式設計驛站 www.cppcns.com 11 月 3 日訊息近日,由馬雲擔綱主演的電影 功守道 引發了眾多的關注。而除了電影,馬雲出了一首新歌,與王菲合作xqejwqgm 功守道 主題曲 風清揚 此次,馬雲不僅圓了演員程式設計客棧夢,還圓了歌手夢。至於馬雲與王菲合作的歌曲 風清揚 好不好聽,相信...