對於防採集的乙個思路

2021-03-31 21:57:07 字數 494 閱讀 6076

最近,網路採集技術很是流行,利用採集技術,可以直接將其它站點的所有資料以及檔案全都存入自己的資料庫和目錄。

很是不幸,本人的blog居然也被某採集狂盯上,以致iis數直接超出本人的小站的極限,到現在還是不能訪問,剛才搜了一下防採集的相關資料,大體有下面幾種方法

這幾種方法除了使用多模版,我覺得其它幾種都不太好,都不同程度的把搜尋引擎都防住了,所以我針對這些也想了一種思路

由於採集程式大都採集得很快,一般1-2秒鐘就能採集乙個頁面  對於多執行緒的甚至是每一秒就能採到數個頁面,所以我們可以採用論壇發帖時間限制的方法,判斷使用者訪問兩個頁面之間的間隔,對它進行限制,當然也有一下人看到一批好的文章可能喜歡同一時間開啟很多視窗,那麼可能對於這部分人也限制住了

所以我們可以擴大時限  如:判斷1分鐘內開啟的頁面是否超過20,如果超過這個數量,葉面就會顯示其它的內容,或是警告資訊,或是其它的欺騙性內容

這是大體思路,還有很多地方有待完善   如對於搜尋蜘蛛的例外,以及演算法的實現等等,等有空再詳細寫出相關**

乙個保密思路

如果你機子被入侵,那麼你最擔心的是什麼?那麼怎麼保護自己呢?這個時候乞求防毒軟體 防火牆,恐怕早沒什麼效果。基於上面的擔心考慮,我想出乙個不是萬能的辦法 1 寫乙個程式,感染本機內除系統目錄外的全部檔案,或者感染你指定的機密檔案。2 程式會自動的在所有源 檔案中插入特定 函式。3 本級每次啟動建立多...

對於golang,for range的乙個誤解

一般情況下我們對於陣列 slice map和channel等型別可能會用到for range進行遍歷。寫法通常如下。buf intfor k,v range buf我之前一度認為在每次迴圈遍歷的時候都會在棧上建立k,v兩個變數。以至於在 中我更偏向於用for迴圈去實現乙個陣列的遍歷。但其實並不是這樣...

推薦乙個做「臺」的思路

推薦乙個做 臺 的思路 雷軍在部落格中寫了一篇關於創業是否做平台的感悟 網際網路創業不妨先放下平台夢 大概的意思是說,創業做平台競爭激烈,不容易成功,不如換一種是思路,先依託於其他人等做大了,再考慮做自己的平台。keso在5g裡分享了乙個 豆丁網 www.doodii.com 這個 其實很簡單,就是...