分布式搜尋引擎相關問題

2021-08-31 21:16:36 字數 384 閱讀 3525

lucene

如果你確實真的不連lucene都不知道是什麼?我覺得你確實不應該,lucene底層的原理是乙個東西,叫做倒排索引。太基礎了。

lucen入門:

倒排序:

elasticsearch

elasticsearch入門,初步至少知道es的一些基本概念,然後包括es的基本部署和基本的使用

面試官可能會怎麼問?

(1)es的分布式架構原理能說一下麼(es是如何實現分布式的啊)?

(2)es寫入資料的工作原理是什麼啊?es查詢資料的工作原理是什麼啊?

(3)es在資料量很大的情況下(數十億級別)如何提高查詢效能啊?

(4)es生產集群的部署架構是什麼?每個索引的資料量大概有多少?每個索引大概有多少個分片?

分布式搜尋引擎

es是基於lucene實現的分布式搜尋引擎 elasticsearch。核心思想是在多台機器上啟動多個es程序例項,組成了乙個es集群。es中儲存資料的基本單位是索引,比如說你現在要在es中儲存一些訂單資料,你就應該在es中建立乙個索引,order idx,所有的訂單資料就都寫到這個索引裡面去,乙個...

ElasticSearch分布式搜尋引擎 高階查詢

本文承接自 elasticsearch分布式搜尋引擎簡介及其增刪改查那些事 elasticsearch分布式搜尋引擎 基本查詢 bool把各種其它查詢通過must 與 must not 非 should 或 的方式進行組合 get testindex511 search must not shoul...

分布式搜尋引擎介紹(一)

google就是典型的分布式搜尋引擎,它由上萬台計算機組成。下面主要講一下分布式搜尋引擎的核心問題以及主要的分布式搜尋引擎設計方法。分布式搜尋引擎的最主要的核心問題 1 分布的資訊獲取和計算,以及對此進行的資料統一 這裡面包括爬蟲或者相應的資料獲取機制的分布,對資訊進行加工的統一管理。2 資料處理後...