pagerank以及個性化的pagerank演算法

2021-09-25 12:01:26 字數 945 閱讀 6362

pagerank最開始是google提出來用來衡量網頁重要度排行的演算法。

她的思想是基於網頁之間互相的鏈結作為加權投票。假如網頁a指向b,

那麼網頁b的重要程度受網頁a的影響,a越重要,則b就越重要。假如網頁c也指向b,

但是c跟a對比,c指向其他網頁的數量(出度)較少,那麼c對b的貢獻程度要大於a對b。

下面是網頁i的重要程度的公式,其中d是乙個概率,in(i)表示所有指向網頁i的網頁。

這公式的思想是模擬乙個隨機衝浪者的瀏覽網頁的行為,公式左邊部分表示該衝浪者以(1-d)/n的概率從瀏覽器輸入url的方式訪問到網頁i,公式右邊部分表示從其他指向網頁i的網頁跳轉過來的。多次迭代後,所有網頁的重要性值會收斂。

用概率轉移的方式表示,公式如下

一次迭代的計算的例子如下:

其中概率轉移矩陣m,

每一列表示網頁j的出度,每列的和加起來是1。

每一行表示網頁i的入度。

個性化的pagerank

個性化的pagerank的目標是要計算所有節點相對於使用者u的相關度。從使用者u對應的節點開始遊走,每到乙個節點都以1-d的概率停止遊走並從u重新開始,或者以d的概率繼續遊走,從當前節點指向的節點中按照均勻分布隨機選擇乙個節點往下游走。這樣經過很多輪遊走之後,每個頂點被訪問到的概率也會收斂趨於穩定,這個時候我們就可以用概率來進行排名了。

部落格個性化

頁面定製css header 將預設的導航頭遮蔽掉,這樣才能把自己的導航欄加上去 定製自己導航欄的樣式 shwtop ul shwtop li shwtop li a,dropbtn 滑鼠移上去,改變背景顏色 shwtop li a hover,dropdown hover dropbtn shwt...

個性化推薦技術

如果說過去的十年是搜尋技術大行其道的十年,那麼個性化推薦技術將成為未來十年中最重要的革新之一。目前幾乎所有大型的電子商務系統,如amazon cdnow netflix等,都不同程度地使用了各種形式的推薦系統。而近來以 發現 為核心的 正開始在網際網路上嶄露頭角,比如側重於 推薦的八寶盒,側重於圖書...

關於個性化閱讀

這篇文章匯聚了國內的個性化閱讀服務,這個領域也是最近比較火的乙個方向,無論未來搜尋引擎,還是瀏覽器,大的方向肯定是個性化推薦,這也是idg等投資機構 的乙個方向,根據使用者的行為喜好來為他推薦相應的服務,國內的大佬們也紛紛開始布局,戰略如下 4 資料在 會針對消費者提供一些個性化的推薦,未來的 可能...