搜尋引擎《原理 技術與系統》讀書筆記(5)

2021-05-28 05:30:24 字數 563 閱讀 8383

hub網頁(hub)

網頁(pic)

內容類別

是從語義上對網頁的內容進行分類

正文是原始網頁中真正描述主題的部分,因此,在某些具體應用中用正文代替原始網頁更為合理。

相關鏈結是指在本網頁中指向與正文內容相關的網頁的鏈結,而非廣告等噪音鏈結。將正文和相關超鏈重新組合就得到了淨化後的網頁。

網頁的表示

構造標籤樹

提取docview模型要素的方法

2: if 該塊中存在重要資訊標籤資訊 then

3: 檢查重要資訊標籤中的內容是否在噪音詞集合中出現

4: if 不在噪音詞集合 then // 為真實重要資訊

5: 將重要資訊標籤的影響因子累加到該內容塊的影響因子上

6: end if

7: if 該內容塊的影響因子大於1 then

8: 提出的權值傳遞策略在標籤樹中傳遞權值

9: end if

10: end if

11:end for

12:計算各個特徵項的權值

搜尋引擎 原理 技術與系統

把今天的看的點知識,挑重要的記下來。搜尋引擎是什麼?搜尋引擎 說到底是乙個計算機應用軟體系統,或者說是乙個網路應用軟體系統。網路搜尋引擎 它根據使用者提交的類自然語言查詢詞或者短語,返回一系列很可能與該查詢相關的網頁資訊,供使用者進一步判斷和選取。全引自 搜尋引擎 原理 技術與系統 呵呵 網路搜尋引...

搜尋引擎技術原理

一 web搜尋引擎技術綜述 二 google技術 四 結束語 搜尋引擎 search engine 是指根據一定的策略 運用特定的電腦程式蒐集網際網路上的資訊,在對資訊進行組織和處理後,為使用者提供檢索服務的系統。一 web搜尋引擎技術綜述 一 引子 隨著網路技術的應用與發展,互連網已經成為資訊的重...

這就是搜尋引擎 讀書筆記一

這就是搜尋引擎 讀書筆記一 相信搜尋引擎對於每乙個愛好演算法甚至愛好技術的it人員都具有強烈的好奇心吧,因為搜尋引擎在網際網路中的地位實在是不可撼動。想象如果網際網路沒有了搜尋引擎,那麼我們平常技術上出現瓶頸了怎麼辦?甚至連普通的生活都離不開搜尋,大學生的你訂餐了嗎?今天,我給大家講解一下搜尋引擎及...