資訊檢索方法及思路

2021-10-04 17:31:28 字數 717 閱讀 7954

2020/04/02 第一次更新

蟲部落·快搜

注: *其實以下的功能都可以在搜尋工具中手動選擇

1. 限定在特定**(限定site)

例子:在搜尋引擎中輸入「spring學習路線 site:zhihu.com」 。

註解:指定 只在zhihu.com這個site下,搜尋 「spring學習路線」 。

2.限定檔案的型別

例子:在搜尋引擎中輸入「spring filetype:pdf」 。

註解: 搜尋與spring有關的內容,且搜尋格式只為pdf

3.限定具體的時段

例子:在搜尋引擎中輸入「spring 2015..2018」 。

註解:限定搜尋內容中包含2015和2018。

4.其他

spring intitle:mvc

待更新。。。

資訊檢索評價方法

乙個文件集 一組用於測試的資訊需求集合,資訊需求可以表示為查詢 一組相關性判定結果,對應每個查詢 文件,通常會賦予乙個二值判定結果 相關 不相關 經驗發現一般測試的查詢數應 50。對於乙個查詢,根據其返回結果可以將整個文件集劃分為4部分 相關不相關 返回真正例 tp 偽正例 fp 不返回偽反例 fn...

資訊檢索之布林檢索

1 倒排索引的兩部分 圖 1 3 2 構建倒排索引的過程 收集需要建立索引的文件 將每篇文件轉換成乙個個詞條的列表,這個過程成為詞條化 第二章 進行語言學處理,產生歸一化的詞條來作為詞項 第三章 對所有文件按照其中出現的詞項來建立倒排索引,索引中包括一部詞典 存於記憶體 和乙個全體倒排索引表 存於磁...

資訊檢索技術 布林檢索

今天先介紹最簡單的資訊檢索技術,布林檢索。資訊檢索 ir 通俗的講,就是要在乙個很大的文字 有時可能是其他資料,如影象等 集合中,找到與使用者需求相關的可以滿足使用者需求的非結構化資訊。聽起來有點拗口,其實就是一種查詢,只不過查詢的物件是非結構化資訊,和查詢資料庫中的表並不相同。希望這麼說能好理解一...