搜尋的基本步驟

2021-06-06 17:47:06 字數 425 閱讀 5593

2023年的基本步驟與現在沒有什麼區別,現在只是提高了每一步的效率和計算效能。

傳統搜尋的基本步驟:

1、爬取:收集要搜尋的文件。

2、解析:將各種文件(xml、html、word、pdf)轉換成統一的結構,即索引中的各個域,這些域都是純文字形式的。

3、分析:解析器能從各個文件中提取出文字內容,但是這些文字內容被索引之前還要經過分析器的處理,它負責的是對所要索引的文字進行分詞。就是找到重要的單詞,忽略不重要的。

4、索引:在一次索引中,lucene的documents物件對應於不同的實體(例如:電子郵件、記錄、法律檔案),不同實體的各個域中的內容是不同的。可以刪除或更新從索引中產生的documents物件。lucene在索引方面另乙個有趣的功能時boosting。所謂boosting,就是給特定的文件賦予特定的重要性,即或高或低。

5、搜尋

編譯的基本步驟

在筆者身邊 普通二本學校 所接觸的搞it的人士,很少有學習或者了解過編譯原理的人。竊以為原因有兩點 一是所從事的領域多數為頂層開發,學習演算法都頭疼的夠嗆了 二是學習氛圍相對較差,沒有開設相應的課程。突然想起了一則笑話,說 一男上非誠勿擾,當女嘉賓們得知他是程式設計師後,一陣 咚嗡 就沒有然後了。編...

ctf web基本步驟

1.看原始碼 可以右鍵 檢視網頁源 也可以用火狐和谷歌瀏覽器的按f12鍵,按f12鍵可以修改html源 方便構造一些值提交,但如果不需要的話直接右鍵檢視源 更直觀,看網頁裡面的注釋之類的都很方便。2.抓包 這幾天接觸到的抓包一般是用burpsuite,如果要多次嘗試可以右鍵 send to repe...

建立ListView的基本步驟

參考 瘋狂android講義 第2.5節p94 1 建立乙個或者多個listview 2 建立textviewresource,為每個元素定義其顯示屬性 array item1.xml array item2.xml 3 建立activity,並完成以下三個步驟 package com.ljh.li...