資訊檢索 倒排記錄表合併演算法實現(python)

2021-10-04 16:15:55 字數 1355 閱讀 6934

倒排記錄表合併演算法偽**如下所示:

①執行程式,看到提示「請輸入詞項word1:」,輸入某個倒排記錄表的詞項。

②執行程式,看到提示「請輸入word1的倒排記錄表(輸入-1,停止輸入倒排記錄表):」時,輸入①步驟詞項的倒排記錄表,當輸入-1時停止輸入此倒排記錄表。

③執行程式,看到提示「請輸入詞項word2:」,輸入某個倒排記錄表的詞項。

④執行程式,看到提示「請輸入word2的倒排記錄表(輸入-1,停止輸入倒排記錄表):」時,輸入③步驟詞項的倒排記錄表,當輸入-1時停止輸入此倒排記錄表。

'''程式說明:

求兩個倒排記錄表的交集

輸入詞項的倒排記錄表時,當輸入-1,停止輸入其倒排記錄表

'''#data字典儲存所有資料

data = {}

#分別輸入兩個詞項以及其對應的倒排記錄表

#輸入詞項word1以及它的倒排記錄表

word1 = str(input("請輸入詞項word1:"))

id_1 =

while 1:

a1 = int(input('請輸入word1的倒排記錄表(輸入-1,停止輸入倒排記錄表):'))

if(a1 != -1):

else:

break

data[word1] = id_1

#輸入詞項word2以及它的倒排記錄表

word2 = str(input('請輸入詞項word2:'))

id_2 =

while 1:

a2 = int(input("請輸入word2的倒排記錄表(輸入-1,停止輸入倒排記錄表):"))

if(a2 != -1):

else:

break

data[word2] = id_2

print('詞項a1為:',word1)

print('詞項a2為:',word2)

print('詞項a1的倒排記錄表為:',data[word1])

print('詞項a2的倒排記錄表為:',data[word2])

#求兩個詞項的並集

same_id =

for i in data[word1]:

if(i in data[word2]):

else:

continue

print("相同的倒排記錄表為:",same_id)

智慧型資訊檢索 兩個倒排記錄表的合併演算法

資訊檢索導論 部分實驗python實現彙總請進入此部落格檢視。使用者通過提示輸入兩個倒排記錄表,系統自動實現倒排記錄表的合併,並將合併結果輸出。分為提示輸入模組與倒排記錄表計算模組兩個功能模組。總體流程圖 各功能模組流程圖 提示輸入模組 倒排記錄表計算模組 輸入第乙個詞項的倒排記錄表,文件id之間用...

資訊檢索導論(第二章) 詞項詞典及倒排記錄表

文件字元生成過程中存在編碼識別問題,一般通過啟發式的機器學習手段來識別或者手工選擇方式來解決 文件的 單位 文件單位即 索引粒度 的設定往往需要根據實際情況的需求設定,粒度過大或者過小都有弊端,粒度過小,詞彙都被包含在篇幅很小的段落中,遺漏了其餘相關的段落後導致正確率高召回率低,粒度過大,正確率低召...

兩個線性表合併為一演算法實現

la和lb是兩個int型陣列,將他們合併為乙個陣列lc 課本p20演算法2.1 include define len la 4 define len lb 7 函式 獲取元素 int getelem int list,int index 函式 插入元素 void listinsert int lis...