Google搜尋從入門到精通 v4 0(二)

2021-03-31 08:57:00 字數 3952 閱讀 5045

7.1、萬用字元問題

很多搜尋引擎支援萬用字元號,如「*」代表一連串字元,「?」代表單個字元等。google

對萬用字元支援有限。它目前只可以用「*」來替代單個字元,而且包含「*」必須用""引起來。比如,「"以*治國"」,表示搜尋第乙個為「以」,末兩個為「治國」的四字短語,中間的「*」可以為任何字元。

7.2、關鍵字的字母大小寫

google對英文本元大小寫不敏感,「god」和「god」搜尋的結果是一樣的。

7.3、搜尋整個短語或者句子

google的關鍵字可以是單詞(中間沒有空格),也可以是短語(中間有空格)。但是,用短語做關鍵字,必須加英文引號,否則空格會被當作「與」操作符。

示例:搜尋關於第一次世界大戰的英文資訊。

搜尋:「"world war i"」

結果:已向英特網搜尋"world war i". 共約有937,000項查詢結果,這是第1-10項 。 搜尋用時0.06秒。

7.4、搜尋引擎忽略的字元以及強制搜尋

google對一些網路上出現頻率極高的英文單詞,如「i」、「***」、「」等,以及一些符號如「*」、「.」等,作忽略處理。

示例:搜尋關於起源的一些歷史資料。

搜尋:「的歷史 inter***」

結果:以下的字詞因為使用過於頻繁,沒有被列入搜尋範圍: 的. 已搜尋有關的歷史 inter***的中文(簡體)網頁。 共約有75,100項查詢結果,這是第1-10項 。 搜尋用時0.22秒。

我們看到,搜尋「的歷史 inter***」,但搜尋引擎把「」和「的」都省略了。於是上述搜尋只搜尋了「歷史」和「inter***」。這顯然不符合要求。這裡我順便說一點搜尋引擎分詞的知識。當我們在搜尋「的歷史」的時候,搜尋引擎實際上把這個短語分成三部分,「」、「的」和「歷史」分別來檢索,這就是搜尋引擎的分詞。所以儘管你輸入了連續的「的歷史」,但搜尋引擎還是把這個短語當成三個關鍵字分別檢索。

如果要對忽略的關鍵字進行強制搜尋,則需要在該關鍵字前加上明文的「+」號。

搜尋:「+ +的歷史 inter***」

結果:已搜尋有關+ +的歷史 inter***的中文(簡體)網頁。 共約有25,000項查詢結果,這是第1-10項 。 搜尋用時0.05秒。

另乙個強制搜尋的方法是把上述的關鍵字用英文雙引號引起來。在上例「」world war i」」中,「i」其實也是忽略詞,但因為被英文雙引號引起來,搜尋引擎就強制搜尋這一特定短語。

搜尋:「"的歷史" inter***」

結果:已搜尋有關"的歷史" inter***的中文(簡體)網頁。 共約有7項查詢結果,這是第1-6項 。 搜尋用時0.26秒。

我們看到,這一搜尋事實上把「的歷史」作為完整的乙個關鍵字。顯然,包含這樣乙個特定短語的網頁並不是很多,不過,每一項都很符合要求。

注意:大部分常用英文符號(如問號,句號,逗號等)無法成為搜尋關鍵字,加強制也不行。

8.1、對搜尋的**進行限制

「site」表示搜尋結果侷限於某個具體**或者**頻道,如「.sina.***.**」、「edu.sina.***.**」,或者是某個網域名稱,如「***.**」、「***」等等。如果是要排除某**或者網域名稱範圍內的頁面,只需用「-**/網域名稱」。

示例:搜尋中文教育科研**(edu.**)上關於搜尋引擎技巧的頁面。

搜尋:「搜尋引擎 技巧 site:edu.**」

結果:已搜尋有關搜尋引擎 技巧 site:edu.**的中文(簡體)網頁。 共約有608項查詢結果,這是第1-10項 。 搜尋用時0.05秒。

" tips site:.zd***.*** or site:.**et.***」

結果:已在.zd***.***內搜尋有關"search engine" tips or site:.**et.***的網頁。 共約有1,040項查詢結果,這是第1-10項 。 搜尋用時0.09秒。

注意,在這裡google有個小bug。「已在.zd***.***內搜尋…」,其實應該表述成「已在.zd***.***和.**et.***內搜尋…」。

注意:site後的冒號為英文本元,而且,冒號後不能有空格,否則,「site:」將被作為乙個搜尋的關鍵字。此外,**網域名稱不能有「http://」字首,也不能有任何「/」的目錄字尾;**頻道則只侷限於「頻道名.網域名稱」方式,而不能是「網域名稱/頻道名」方式。

8.2、在某一類檔案中查詢資訊

示例:搜尋幾個資產負債表的office文件。

搜尋:「資產負債表 filetype:doc or filetype:xls or filetype:***」

結果:已搜尋有關資產負債表 filetype:doc or filetype:xls or filetype:***的中文(簡體)網頁。 共約有481項查詢結果,這是第1-10項 。 搜尋用時0.04秒。

示例:搜尋一些關於搜尋引擎知識和技巧方面的pdf文件

搜尋:「"search engine" tips or tutorial filetype:pdf」

結果:已向英特網搜尋"search engine" tips or tutorial filetype:pdf. 共約有12,600項查詢結果,這是第1-10項 。 搜尋用時0.22秒。

我們來看其中的乙個結果:

[pdf]search engines tips

文件型別: pdf/adobe acrobat - html 版

.allvertical.***/promokits/searchengi***ips.pdf - 類似網頁

可以看到,google用[pdf]來標記這是乙個pdf的文件檢索,另外,它還給出了該pdf文件的html版本,該html版保留了文件的文字內容和結構,但沒有。

8.3、搜尋的關鍵字包含在url鏈結中

示例:查詢midi曲「滄海一聲笑」。

搜尋:「inurl:midi 「滄海一聲笑」」

結果:已搜尋有關inurl:midi "滄海一聲笑"的中文(簡體)網頁。 共約有27項查詢結果,這是第1-10項 。 搜尋用時0.34秒。

注意:「inurl:」後面不能有空格,google也不對url符號如「/」進行搜尋。例如,google會把「cgi-bin/phf」中的「/」當成空格處理。

「allinurl」語法返回的網頁的鏈結中包含所有作用關鍵字。這個查詢的關鍵字只集中於網頁的鏈結字串。

示例:查詢可能具有phf安全漏洞的公司**。通常這些**的cgi-bin目錄中含有phf指令碼程式(這個指令碼是不安全的),表現在鏈結中就是「網域名稱/cgi-bin/phf」。

搜尋:「allinurl:"cgi-bin" phf +***」

結果:已向英特網搜尋allinurl:"cgi-bin" phf +***. 共約有51項查詢結果,這是第1-10項 。 搜尋用時0.11秒。

8.4、搜尋的關鍵字

包含在網頁標題中

「intitle」和「allintitle」的用法類似於上面的inurl和allinurl,只是後者對url進行查詢,而前者對網頁的標題欄進行查詢。網頁標題,就是html標記語言title中之間的部分。網頁設計的乙個原則就是要把主頁的關鍵內容用簡潔的語言表示在網頁標題中。因此,只查詢標題欄,通常也可以找到高相關率的專題頁面。

示例:查詢日本明星藤原紀香的**集。

搜尋:「intitle:藤原紀香 "寫真集"」

結果:已搜尋有關intitle:藤原紀香 "寫真集"的中文(簡體)網頁。 共約有315項查詢結果,這是第1-10項 。 搜尋用時0.15秒。

8.5、搜尋的關鍵字包含在網頁的「錨」(anchor)鏈點內

所謂「錨」,就是在同乙個網頁中快速切換鏈結點。與url和title類似,google提供了兩種對anchor的檢索,「inanchor」和「allin**chor」。對此不作詳述。

GOOGLE搜尋從入門到精通

一,google簡介 google google.是乙個搜尋引擎,由兩個史丹福大學博士生larry page與sergey brin於1998年9月發明,google inc.於1999年創立。2000年7月份,google替代inktomi成為yahoo公司的搜尋引擎,同年9月份,google成為...

GOOGLE搜尋從入門到精通

一,google簡介 google google.是乙個搜尋引擎,由兩個史丹福大學博士生larry page與sergey brin於1998年9月發明,google inc.於1999年創立。2000年7月份,google替代inktomi成為yahoo公司的搜尋引擎,同年9月份,google成為...

GOOGLE搜尋從入門到精通

一,google簡介 google google.是乙個搜尋引擎,由兩個史丹福大學博士生larry page與sergey brin於1998年9月發明,google inc.於1999年創立。2000年7月份,google替代inktomi成為yahoo公司的搜尋引擎,同年9月份,google成為...