搜尋引擎的技術問題(未完待續)

2022-04-28 23:33:11 字數 1028 閱讀 8273

搜尋引擎的技術奧秘

搜尋引擎————

在世界上最大的草垛中尋針

搜尋引擎已經發展成為每個人上網都離不開的重要工具,但是為何搜尋引擎有著如此重要的地位?其技術發展歷程是怎樣的?其基本目標是什麼?核心問題是什麼?基本技術架構如何?本文將做盡可能詳細的分析與講解。

搜尋引擎提供著超級服務,每個大型的搜尋引擎公司都運營者乙個由有無數資料中心組成的國際網路,其中包括數以千計的伺服器計算機和先進的網路裝置。但是如果沒有聰明的演算法來組織和檢索我們請求的資訊,所有的硬體都會變得毫無用途。

搜尋引擎的兩大主要任務是:匹配和排名。

網路搜尋的兩個階段匹配和排名,在第一階段(匹配)後可能會出現數千或數百萬個匹配結果,這些結果必須按照相關度在第二階段(排名)進行排序。搜尋引擎會從大量命中裡挑出最好的幾個,乙個好的搜尋引擎不僅會挑出最好的幾個,而且還會以最有用的順序顯示它們——最匹配的頁面排在第一,然後是匹配度排名第二的,以此類推。

下面介紹一下相關商業引擎公司的發展,2023年是商業搜尋引擎公司發展的重要起點,背景是:網際網路上的web站點數量首次超過100萬,此時的普通使用者無法依賴手工瀏覽的方式來快速獲得自己想要的資訊。這一年產生了很多曾經風雲一時的早期搜尋引擎公司。yahoo、infoseek、fast search、alta vista、excite等曾經非常著名的搜尋引擎公司都建立於2023年。

搜尋引擎的3個目標:更全、更快、更準。

搜尋引擎的3個核心問題:

1.使用者的真正需求是什麼   根據資料調查使用者輸入的查詢請求平均長度只有2.7的單詞,要從如此短的請求裡獲知使用者的真正需求,這是搜尋引擎首先要解決的並且非常重要的問題。即是需要弄懂使用者它們搜尋的真正意圖是什麼。

3.哪些資訊是使用者可以信賴的   搜尋到的資訊是否值得信賴又是另外乙個重要的衡量標準。網上發布的資訊物件會是由任意使用者發布,內容可信與否並無判斷標準,也存在惡意的發布資訊的情況。在同乙個查詢的搜尋結果內,完全可能存在相互矛盾的搜尋答案,此時資訊的可信性即成為突出問題。

搜尋引擎檢索技術

謝海勸 如此簡單的乙個輸入框 搜尋按鈕,卻可以實現如此神奇的一站式搜尋服務,為使用者提供豐富 準確的資訊,這要歸功於乙個強勁的後台引擎。使用者可曾想過,這麼簡單的行為,後台引擎可能會有成千上萬臺機器在為你服務。搜尋引擎就像一台高效運轉的發動機,不停響應使用者的請求,輸出使用者想要的資訊。高效的檢索系...

搜尋引擎檢索技術

如此簡單的乙個輸入框 搜尋按鈕,卻可以實現如此神奇的一站式搜尋服務,為使用者提供豐富 準確的資訊,這要歸功於乙個強勁的後台引擎。使用者可曾想過,這麼簡單的行為,後台引擎可能會有成千上萬臺機器在為你服務。搜尋引擎就像一台高效運轉的發動機,不停響應使用者的請求,輸出使用者想要的資訊。高效的檢索系統需要提...

搜尋引擎檢索技術

如此簡單的乙個輸入框 搜尋按鈕,卻可以實現如此神奇的一站式搜尋服務,為使用者提供豐富 準確的資訊,這要歸功於乙個強勁的後台引擎。使用者可曾想過,這麼簡單的行為,後台引擎可能會有成千上萬臺機器在為你服務。搜尋引擎就像一台高效運轉的發動機,不停響應使用者的請求,輸出使用者想要的資訊。高效的檢索系統需要提...