es搜尋核心與實戰Day07

2021-10-07 16:13:31 字數 1762 閱讀 2020

​ hash演算法確保文件均勻分散到分片中

​ 預設的_routing 值是文件id

​ 可以自行制定routing數值,例如用相同國家的商品,都分配到指定的shard

​ 設定index setting後,primary數,不能隨意修改的更本原因

更新乙個文件

a.倒排索引的不可變性

​ 1.無需考慮併發寫檔案的問題,避免了鎖機制帶來的效能問題

​ 2.一旦讀入核心的檔案系統快取,便留在**。只要檔案系統存有足夠大的空間,大部分請求就會直接請求記憶體,不會命中磁碟,提公升了很大的效能

​ 3.快取容易生成和維護/資料可以被壓縮

​ 呼叫refresh,index buffer清空並且refresh

​ 呼叫fsync,將快取中的segments寫入磁碟

​ 清空(刪除)transaction log

​ 預設30分鐘呼叫一次

​ transaction log滿(預設512mb)

​ 減少segments/刪除已經刪除的文件

​ post my_index/_forcemerge

​ 每個分片上需要查的文件個數=from+size

​ 最終協調點需要處理:number_of_shard*(from+size)

​ 深度分頁

​ 當資料量足夠大時侯,只要保證文件均勻分散在各個分片上,結果一般就不會出現偏差

​ 搜尋的url中指定引數「_search?search_type=dfs_query_then_fetch」

post message/_doc

post message/_doc

post message/_doc

post message/_search}}

}delete message

put message

}get message

post message/_doc?routing=

1post message/_doc?routing=

2post message/_doc?routing=

3post message/_search}}

}//type dfs_query_then_fetch

post message/_search?search_type=dfs_query_then_fetch}}

}

//單字段排序

post /kibana_sample_data_ecommerce/_search},

"sort":[

}]}//多欄位排序

post /kibana_sample_data_ecommerce/_search},

"sort":[

},},

}]}//對text排序報錯

post /kibana_sample_data_ecommerce/_search},

"sort":[

}]}//開啟text的 fielddata}}

}}

​ 1.fielddata

​ 2.dov values(列式儲存,對text型別無效)

關閉dov values

增加索引的速度/減少磁碟空間

實戰day07(七) 商品搜尋

返回的結果 1 商品列表 2 總頁數 3 總記錄數 使用jsp展示,返回邏輯檢視。商品列表使用 searchitem表示。需要把查詢結果封裝到乙個pojo中 1 商品列表list 2 總頁數。int totalpages。總記錄數 每頁顯示的記錄數向上取整。把每頁顯示的記錄是配置到屬性檔案中。3 總...

es搜尋核心與實戰 Day02

倒排索引包含兩個部分 單詞詞典一般比較大,可以通過b 樹或雜湊拉鍊法實現,以滿足高效能的插入與查詢 get analyze 1.standard analyzer 2.analyzer 3.whitespace analyzer 4.stop analyzer 5.keyword analyzer ...

es搜尋核心與實戰Day05

1.詞頻tf term frequency 檢索詞在子篇文件 現的頻率 檢索詞出現的次數除以文件的總字數 度量一條查詢和結果文件相關性的簡單方法 簡單將搜尋中每一乙個詞的tf進行相力 tf 區塊鏈 tf 的 tf 應用 stop word 的 在文件 現了很多次,但是對貢獻相關度幾乎沒有用處,不應該...