倒排索引,反向索引,Inverted index

2021-08-30 01:57:02 字數 907 閱讀 3398

倒排索引(英語:inverted index),也常被稱為反向索引置入檔案反向檔案,是一種索引

方法,被用來儲存

在全文搜尋

下某個單詞在乙個文件或者一組文件中的儲存位置

的對映。它是文件檢索系統

中最常用的資料結構

。有兩種不同的反向索引形式:

後者的形式提供了更多的相容性

(比如短語搜尋

),但是需要更多的時間和空間來建立。

以英文為例,下面是要被索引的文字:

我們就能得到下面的反向檔案索引:

"a":      

"banana":

"is":

"it":

"what":

檢索的條件"what","is""it"將對應這個集合

:對相同的文字,我們得到後面這些完全反向索引,有文件

數量和當前查詢的單詞結果組成的的成對資料

。 同樣,文件數量和當前查詢的單詞結果都從零開始。所以,"banana":就是說 "banana"在第三個文件裡 (t

2),而且在第三個文件的位置是第四個單詞(位址為 3)。

"a":      

"banana":

"is":

"it":

"what":

如果我們執行短語搜尋"what is it"我們得到這個短語的全部單詞各自的結果所在文件為文件0和文件1。但是這個短語檢索的連續的條件僅僅在文件1得到。

正排索引與倒排索引

什麼是正排索引 forward index 由key查詢實體的過程,是正排索引.什麼是倒排索引 inverted index 由item查詢key的過程,是倒排索引。倒排索引可以理解為map item,list id 能夠由查詢詞快速 時間複雜度o 1 找到包含這個查詢詞的檔案的資料結構。舉例 文件...

倒排索引原理 機器學習基礎 倒排索引與搜尋引擎

在介紹倒排索引之前,我們先來看看什麼是索引。索引是資料庫當中的概念,維基百科中的說法是 資料庫索引,是資料庫管理系統中乙個排序的資料結構,以協助快速查詢 更新資料庫表中資料 可以簡單地把索引當成是字典裡的檢索目錄,我們比如我們要查乙個叫 index 的單詞,通過目錄,可以快速地找到字母i開始的位置。...

倒排索引 和 倒排表

為什麼我們要說倒排索引呢?因為倒排索引是目前 搜尋引擎公司最對搜尋引擎最常用的儲存方式.也是搜尋引擎的核心內容 在搜尋引擎實際的引用之中,有時需要按照關鍵字的某些值查詢記錄,所以我們是按照關鍵字建立索引,這個索引我們就稱之為 倒排索引,而帶有倒排索引的檔案我們又稱作 倒排索引檔案也可以叫它為 倒排檔...