搜尋引擎反作弊之 鏈結作弊與隱藏作弊

2021-06-05 08:33:46 字數 1625 閱讀 9321

本文節選自《這就是搜尋引擎:核心技術詳解》第八章

8.2 鏈結作弊

所謂「鏈結作弊」,是**擁有者考慮到搜尋引擎排名中利用了「鏈結分析」技術,所以通過操縱頁面之間的鏈結關係,或者操縱頁面之間的鏈結錨文字,以此來增加鏈結排序因子的得分,並影響搜尋結果排名的作弊方法。常見的鏈結作弊方法眾多,此節簡述幾種比較流行的作弊方法。

1.鏈結農場(link farm)

為了提高網頁的搜尋引擎鏈結排名,「鏈結農場」構建了大量互相緊密鏈結的網頁集合,期望能夠利用搜尋引擎鏈結演算法的機制,通過大量相互鏈結來提高網頁排名。「鏈結農場」內的頁面鏈結密度極高,任意兩個頁面都可能存在互相指向鏈結。圖8-2展示了乙個精心構建的鏈結農場。

圖8-2 鏈結農場

2.goolge 轟炸(google bombing)

「錨文字」是指向某個網頁的鏈結描述文字,這些描述資訊往往體現了被指向網頁的內容主題,所以搜尋引擎往往會在排序演算法中利用這一點。

作弊者通過精心設定錨文字內容來誘導搜尋引擎給予目標網頁較高排名,一般作弊者設定的錨文字和目標網頁內容沒有什麼關係。

圖8-3  google轟炸的原理

圖8-4  google轟炸後的效果

4.購買鏈結

5.購買過期網域名稱

有些作弊者會購買剛剛過期的網域名稱,因為有些過期網域名稱本身的pagerank排名是很高的,通過購買網域名稱可以獲得**值的外鏈。

6.「門頁」作弊(doorway pages)

「門頁」本身不包含正文內容,而是由大量鏈結構成,而這些鏈結往往會指向同一**內的頁面,作弊者通過製造大量的「門頁」來提公升**排名。

8.3 頁面隱藏作弊

1.      ip位址**作弊(ip cloaking)

2.      http請求**作弊(user agent cloaking)

客戶端和伺服器在獲取網頁頁面的時候遵循http協議,協議中有一項叫做「使用者**項」(user agent)。搜尋引擎爬蟲往往會在這一項有明顯的特徵(比如google爬蟲此項可能是:googlebot/2.1),伺服器如果判斷是搜尋引擎爬蟲則會推送和使用者看到的不同的頁面內容。

圖8-5是乙個http請求隱藏作弊的例子,作弊**伺服器推送給搜尋引擎爬蟲的頁面是講述**食品的內容,而推送給頁面訪問者的則是**產品銷售推廣頁面。這樣當使用者在搜尋**知識的時候就會直接訪問**產品頁面,從而達到作弊者的商業目的。

圖8-5  http請求隱藏作弊

3.      網頁重定向

作弊者使得搜尋引擎索引某個頁面內容,但是如果是使用者訪問則將頁面重定向到乙個新的頁面。

4.頁面內容隱藏

搜尋引擎反作弊之 整體技術思路

如上所述,目前搜尋引擎作弊手段五花八門,層出不窮,作為應對方的搜尋引擎,也相應調整技術思路,不斷有針對性地提出反作弊的技術方案,所以如果整理反作弊技術方案,會發現技術方法很多,理清思路不易。儘管如此,如果對大多數反作弊技術深入分析,會發現在整體技術思路上還是有規律可循。從基本的思路角度,可以將反作弊...

搜尋引擎反作弊與冪律分布

由於搜尋引擎普遍基於pagerank在做,有一種很常見的手法就是給乙個網頁設定足夠多的入鏈和出鏈,以提高網頁的搜尋權重。搜尋引擎針對這種作弊方式,會用到 冪律分布 來識別。即,網頁的出鏈和入鏈是否滿足以下規律 少量鏈結擁有大量流量,大量鏈結擁有少量流量。也可以更通俗的說,是否符合二八定理。如果乙個網...

SEO獨家揭秘 搜尋引擎如何識別鏈結作弊!

國內的搜尋引擎在關於 外鏈 的文章裡面,絕大多數會強調外鏈的價值,很少去強調鏈結背後的反作用,也就是今天要給大家深度解讀的鏈結作弊。筆者在seo領域從業多年,但是在搜尋引擎鏈結分析這塊,見證過各種鏈結對於排名的提公升和下降,也測試過數百個站點的排名動向。這次我們一如既往,用實戰排名案例去給大家完全解...