Google新索引系統Caffeine領先業界

2021-05-22 19:11:54 字數 960 閱讀 7110

google公司的軟體工程師格里梅斯(carrie grimes)周二(6月8日)在google的官方部落格中宣布,google已經開發出速度更快、檢索結果更準確的新型網路內容索引系統 caffeine。

格里梅斯在部落格中寫道,當前google使用的索引技術相比,caffeine檢索結果時效性會提高50%。無論是網路新 聞,還是部落格文章以及論 壇發帖內容,一旦這些內容發布,caffeine將能馬上收錄這些內容的相應鏈結。

google的老式索引系統採用了多層技術,那種情況下部份索引層的內容更新快於其他層面;主索引層通常是每隔數週更新一次。如果要更新其中的某個 索引層,就是必須對整個網際網路進行分析。如此一來,網民所搜尋到的結果,與網際網路的實際內容之間會有乙個時間差。

caffeine技術將網際網路劃分為不同的部份,然後對不同部份內容在全球範圍內進行持續的公升級。一旦發現了新內容,就將其新增到 當前索引當中。這就是說,你在使用google搜尋過程中,所獲得的結果與網際網路實際內容的時間差已經非常小。

caffeine技術也 可以實現對網路內容索引的規模化。格里梅斯稱,caffeine每秒鐘可同時處理數十萬個網頁。如果這些網頁是現實生活中的紙張,則這些紙張每秒鐘將堆成 3英里高。caffeine在乙個資料庫中可處理近1億gb的儲存資訊,且每天儲存資訊量都在大幅增長。你需要使用62.5萬部容量最大的ipod**播 放器才能儲存這些資訊,如果將這些ipod併排放置,則可長達40英里。

去年8月期間,google首次對外公布了caffeine的 部份技術細節。google開發caffeine的主要原因是:應對來自微軟必應(bing)、「知識引擎」wolfram alpha等競爭對手的挑戰,以保持google在搜尋引擎技術產業的領先地位。

caffeine不僅僅提高了網路索引的時效性,而且 使組建效能更強大的搜尋引擎成為可能,籍此向網民提供質量更好的搜尋服務。

Google的新陰謀 原作

google的新陰謀 作者 cnss 這些日子gmail很受關注,不管是否用的上大家都想得到乙個,原因不外呼有二 1.它太大了.2.很多人是goolge的fans,所以儘管別的服務商也推出了超大郵箱,但還是認準gmail.google推出1g郵箱,當然不是因為他們公司硬碟買多了,按照google的說...

各個作業系統版本在google的索引量

閒來無事,突然想看看各個作業系統版本在網路上的上鏡率,就在google中,以各個作業系統的名字為關鍵字進行搜尋,結果如下表 數字的括號後面是用來搜尋的關鍵字 linux linux 757,000,000 linux redhat 5,670,000 redhat 24,000,000 redhat...

google工具欄新覽

另外,據google官方部落格報道,在最新的internet explorer和firefox的google工具欄中已經新增了一項新服務,可以把當前的 分享到各個社會化網路 部落格或電子郵件裡。例如,當使用者看到乙個不錯的網頁,點google工具欄的 共享 按鈕裡的twitter選項,工具欄就可以建...