判斷IP是否為搜尋引擎蜘蛛或爬蟲

2021-07-10 21:20:23 字數 4393 閱讀 3838

判斷ip是否為搜尋引擎蜘蛛或爬蟲

主要是通過向dns伺服器傳送反向網域名稱解析查詢,獲取指定ip的相關網域名稱資訊來判斷是否為相應搜尋引擎或爬蟲. 

通過 dig 或者 host 工具皆可查詢.

example:

> dig -x 8.8.8.8 +short

google-public-dns-a.google.com.

> dig google-public-dns-a.google.com +short

8.8.8.8

example:

> host 8.8.8.8

8.8.8.8.in-addr.arpa domain name pointer google-public-dns-a.google.com.

> host google-public-dns-a.google.com

google-public-dns-a.google.com has address 8.8.8.8

google-public-dns-a.google.com has ipv6 address 2001:4860:4860::8888

常見搜尋引擎蜘蛛及官方說明

如何識別搜尋引擎蜘蛛IP

可以通過dns反查方式來解決這個問題。根據平台不同驗證方法不同,如linux windows os三種平台下的驗證方法分別如下 1 在linux平台下,您可以使用host ip命令反解ip來判斷是否來自baiduspider的抓取。baiduspider的hostname以 baidu.com或 b...

常見搜尋引擎蜘蛛大全

谷歌 google.com googlebot http www.google.com bot.html 中文版請開啟以下頁面 雅虎 yahoo.com yahoo http misc.yahoo.com.cn help.html 開啟後跳轉到以下頁面 有道 yodao.com yodaobot 搜...

搜尋引擎蜘蛛爬蟲原理

1 聚焦爬蟲工作原理及關鍵技術概述 相對於通用網路爬蟲,聚焦爬蟲還需要解決三個主要問題 1 對抓取目標的描述或定義 2 對網頁或資料的分析與過濾 3 對url的搜尋策略。抓取目標的描述和定義是決定網頁分析演算法與url搜尋策略如何制訂的基礎。而網頁分析演算法和候選url排序演算法是決定搜尋引擎所提供...