搜尋引擎工作原理

2021-06-16 11:38:48 字數 676 閱讀 4761

搜尋引擎優化的主要任務之一就是提高**的搜尋引擎友好性,因此,搜尋引擎優化的每乙個環節都會與搜尋引擎工作流程存在必然的聯絡,研究搜尋引擎優化實際上就是對搜尋引擎工作過程進行逆向推理。因此,學習搜尋引擎優化應該從了解搜尋引擎的工作原理開始。

搜尋引擎的主要工作包括:「頁面收錄」、「頁面分析」、「頁面排序」及「關鍵字查詢」。

1.    頁面收錄

頁面收錄就是指搜尋引擎通過蜘蛛程式在網際網路上抓取頁面並進行儲存的過程,為搜尋引擎開展各項工作提供了資料支援。

2.頁面分析

頁面分析首先是對原始頁面建立索引,實現對頁面的快速定位;然後,提取頁面的正文資訊,並對正文資訊進行切詞以及為這些詞(即:關鍵字)建立索引,從而得到頁面與關鍵字的之間對應關係;最後,對所有關鍵字進行重組,並建立關鍵字與網頁間對應關係的反向索引列表,從而實現根據關鍵字快速定位至相應的網頁。

3.頁面排序

搜尋引擎結合頁面的內外部因素計算出頁面與某個關鍵字的相關程度,從而得到與該關鍵字相關的頁面排序列表。

4.關鍵字查詢

搜尋引擎接收來自使用者的查詢請求,並對查詢資訊進行切詞及匹配以後,再向使用者返回相應的頁面排序列表。

在本章接下來的內容裡將向讀者介紹搜尋引擎各個主要工作的流程、原理及作用,以及在對**進行優化時應該如何應對。

搜尋引擎工作原理

搜尋引擎工作原理 爬行和抓取 預處理 排名 爬行和抓取 1,是通過蛛蛛程式來實現的,蛛蛛主要是通過鏈結來抓取所有頁面的.所以要想讓蛛蛛盡量的抓取頁面,必須要吸引蛛蛛 優化 2,為了避免重複爬行和抓取 搜尋引擎建立了乙個位址庫用來儲存已經抓取的頁面 位址庫中的url 大多數是蛛蛛獲取到的,當然也有一些...

搜尋引擎工作原理

你剛才在 上買了一件東西 在首頁搜尋框中輸入 毛衣 二字並按回車鍵,這時你又產生了乙個pv,然後,網的主搜尋系統便開始為你服務,它首先對你輸入的內容基於乙個分詞庫進行分詞操作。眾所周知,英文是以詞為單位的,詞和詞之間靠空格隔開,而中文是以字為單位,句子中所有的字連起來才能描述乙個意思。例如,英文句子...

搜尋引擎的工作原理

搜尋引擎是通過一種特定的規律的軟體跟蹤網頁的鏈結,從乙個鏈結爬到另乙個鏈結,像蜘蛛在蜘蛛網上爬行一樣,所以被稱為 蜘蛛 也被稱為是 機械人 搜尋引擎的爬行是被輸入了一定的規則的,它需要遵從一些命令或檔案的內容。搜尋引擎是通過蜘蛛跟蹤鏈結爬行到網頁,並將爬行的資料存入到原始頁面資料庫。其中的頁面資料與...