1、資料的分類
1)結構化資料
格式固定、長度固定、資料型別固定。
例如資料庫中的資料
2)非結構化資料
word文件、pdf文件、郵件、html、txt
格式不固定、長度不固定、資料型別不固定。
2、資料的查詢
1)結構化資料的查詢
sql語句,查詢結構化資料的方法。簡單、速度快。
2)非結構化資料的查詢
從文字檔案中找出包含spring單詞的檔案。
1、目測
2、使用程式吧文件讀取到記憶體中,然後匹配字串。順序掃瞄。
3、把非結構化資料變成結構化資料
先跟根據空格進行字串拆分,得到乙個單詞列表,基於單詞列表建立乙個索引。
然後查詢索引,根據單詞和文件的對應關係找到文件列表。這個過程叫做全文檢索。
索引:乙個為了提高查詢速度,建立某種資料結構的集合。
3、全文檢索
先建立索引然後查詢索引的過程叫做全文檢索。
索引一次建立可以多次使用。表現為每次查詢速度很快。
什麼是全文檢索與全文檢索系統
全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...
什麼叫全文檢索 全文檢索概念
全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...
什麼叫全文檢索 全文檢索概念
全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...