快取迅雷 XUNLEI 的工作原理揭密

迅雷(xunlei)如何搜尋乙個資源的多伺服器版本？

-------

實現乙個類似迅雷的系統「福雷（

fulei

）」來自：

mudboy@csdn

摘要：

我們的福雷要做同迅雷差不多的事，讀下文時可以暫將福字替換成迅。

談了這麼多，還沒有談到一點技術性的內容，真唐僧！

現在的關鍵問題是如何判斷檔案的同價性？也就是說，如何知道這幾個檔案是一樣的？儲存這個資訊對我信至關重要，通過檔名？顯然不行，通過修改時間？作者？大小？等，都不太準確，最常用的方法還是計算檔案摘要，而計算檔案摘要最常用的方法又是md5（雖說md5可以破解，但對於大眾化應用，這種破解沒什麼意義，而在非人為狀況下，md5可以認為是可靠的），但這又出現乙個新的難題，計算摘要需要所在檔案內容，我們有以下選擇：

利用摘要判斷檔案等價性的方法有乙個好處是可以忽略一些次要資訊，比如檔名，建立時間，修改時間等，但檔案型別，長度和摘要則是需要考慮的成份。也就是說，如果這三者一樣，則我們認為檔案是一樣的。

儲存完上述資訊，至於如何索引，考慮的因素可能會多一些，最簡單的就以摘要索引就行，這樣等價資源會被聚類到一起，但作為乙個資源聚集點，資源的描述資訊也是要考慮進去的，等下我們會專門談到這個問題。

1、先看看普通的鏈結（非福雷鏈結）

a)/movie/wanfang.rmvb

b)c)

服務端根據鏈結找自己伺服器，看是否已被系統crawler處理過，如果已被處理過，很簡單，通過其摘要找到所有含有該資源的伺服器鏈結發到客戶端。

d)e)

f)g)

h)2、再看看專用鏈結，比如，你通過雷區找到的資源，有一些鏈結類似如下形式：

thunder://qufmdha6bdcsdi/ry+l1byaxfdif=

說了這麼多，本來應該畫個框架圖流程圖什麼的，但願說清楚了，有什麼好的想法可以多交流。

快取迅雷 XUNLEI 的工作原理揭密

快取的工作原理

CPU快取的工作原理

Web快取工作原理

快取 迅雷 XUNLEI 的工作原理揭密

快取的工作原理

CPU快取的工作原理

Web快取工作原理

相關推薦

快取迅雷 XUNLEI 的工作原理揭密