網路營銷教程 SEO 第二章 搜尋引擎(第一節)

2022-02-25 05:13:44 字數 903 閱讀 1154

圖3搜尋引擎抓取網頁過程

一、蒐集器

四、檢索器

檢索器的功能是根據使用者的查詢在索引庫中快速檢出文件,進行文件與查詢的相關度評價,對將要輸出的結果進行排序,並實現某種使用者相關性反饋機制。檢索器常用的資訊檢索模型有集合理論模型、代數模型、概率模型和混合模型等多種,可以查詢到文字資訊中的任意字詞,無論出現在標題還是正文中。

檢索器從索引中找出與使用者查詢請求相關的文件,採用與分析索引文件相識的方法來處理使用者查詢請求。如在向量空間索引模型中,使用者查詢q首先被表示為乙個範化向量v(q)=(t1,w1(q); …; ti,wi(q); …; tn,wn(q)),然後按照某種方法來計算使用者查詢與索引資料庫中每個文件之間的相關度,而相關度可以表示為查詢向量v(q)與文件向量v(d)之間的夾角余弦,最後將相關度(怎樣判斷相關度?檔案內容、檔案的反響鏈結數與質量)大於閥值的所有文件按照相關度遞減的順序排列並返還給使用者。當然搜尋引擎的相關度判斷並不一定與使用者的需求完全吻合。

五、使用者介面

使用者介面的作用是為使用者提供視覺化的查詢輸入和結果輸出介面,方便使用者輸入查詢條件、顯示查詢結果、提供使用者相關性反饋機制等,其主要目的是方便使用者使用搜尋引擎,高效率、多方式地從搜尋引擎中得到有效的資訊。使用者介面的設計和實現必須基於人機互動的理論和方法,以適應人類的思維和使用習慣。

在查詢介面中,使用者按照搜尋引擎的查詢語法制定待檢索詞條及各種簡單或高階檢索條件。簡單介面只提供使用者輸入查詢串的文字框,複雜介面可以讓使用者對查詢條件進行限制,如邏輯運算(與、或、非)、相近關係(相鄰、near)、網域名稱範圍(如edu、com)、出現位置(如標題、內容)、時間資訊、長度資訊等等。目前一些公司和機構正在考慮制定查詢選項的標準。

在查詢輸出介面中,搜尋引擎將檢索結果展現為乙個線性的文件列表,其中包含了文件的標題、摘要、快照和超鏈等資訊。由於檢索結果中相關文件和不相關文件相互混雜,使用者需要逐個瀏覽以找出所需文件。

網路營銷教程 SEO 第二章 搜尋引擎(第二節)

第二節 搜尋引擎的中文分詞技術 中文自動分詞是網頁分析的基礎。在網頁分析的過程中,中文與英文的處理方式是不同的,這是因為中文資訊與英文資訊有乙個明顯的差別 英文單詞之間有空格,而中文文字中詞與詞之間沒有分割符。這就要求在對中文網頁進行分析之前,先要將網頁中的句子切割成乙個個的詞的序列,這就是中文分詞...

《網路營銷教程 SEO》 第三章搜尋引擎營銷

網路營銷教程 seo 中國站長站 chinaz.com 獨家 發布。如有 或作他用,敬請聯絡該書權益人張棟偉。第一節 什麼叫搜尋引擎營銷 一 搜尋引擎營銷的定義 搜尋引擎營銷,是英文search engine marketing的翻譯,簡稱為sem。簡單來說,搜尋引擎營銷就是基於搜尋引擎平台的網路營...

網路營銷教程 SEO 第一章 網路營銷(下)

首先,我覺得有必要提出blog營銷的乙個基本原則,那就是文章的可讀性。這個原則很重要,如果脫離了這個原則,那寫出的文章就已經不是blog營銷所需求的了。在執行blog營銷過程中,blog上應該發表什麼型別的文章已經哪些人可以參與其中?如何把握blog營銷寫作的核心?很簡單,那就是立足於本行業。乙個企...