solr初步認識之為什麼要用到搜尋引擎技術

2021-10-05 03:38:44 字數 856 閱讀 6197

目錄

場景:資料庫方案:

索引:引出:

搜素分類:

200w表資料搜素查詢:

select * from table where name like '%關鍵字%'
無法確定索引從哪開始,導致索引失效

select * from table where name like '關鍵字%'
這種可以確定從哪開始,但是不符合業務需求(搜尋服務需要提供:搜尋內容拆分)

導致全表掃瞄,速度慢,資料庫壓力大

為了提供資料庫的搜尋速度

可以建立資料庫索引

mysql5.6版本之後,提供了全文索引full——index(之前有普通索引和唯一索引  命名規範: idx_sline_slineid)

類似書的目錄

本質是一種資料結構

分為雜湊資料結構(btree):方便定值查詢

樹資料結構:方便範圍查詢

業務系統,通常採用樹資料結構

***:更新速度慢,索引的建立和維護及其耗時,多維護這棵樹(索引一般用於搜尋頻率高的字段)

如果在資料庫中做這些搜尋,full_index可以實現,但是增加了資料庫的負擔,還有效能和分詞上的問題引出

優化:減少資料庫壓力,資料庫式走磁碟的方式io,不方便拓展

搜尋引擎技術solr(apache)、es(elasticsearch,大資料,旗下產品kibana日誌系統)

為什麼搜尋引擎不搞個分類式搜尋呢?

今天我用搜尋了關鍵詞 蘇州做個 需要多少錢 其呈現出的搜尋結果實在是不能另人滿意 如下圖 於是我就想搜尋引擎為什麼不搞個分類式搜尋呢?這樣不就可以大大提高搜尋結果的準確性了嗎?但是我後來又想也許這就違背了搜尋引擎的初衷,搜尋引擎想要給大家呈現的是大家可以盡情的去搜尋。其它的東西交給我來做,你只需要 ...

為什麼搜尋引擎收錄外鏈不穩定?

對於seoer來說,每天上班開啟電腦第一件事情應該是檢查 的關鍵字排名動態 百www.cppcns.com度快照收錄以及外鏈數量等資料。但今早檢測 相關數量時候突然發現其中乙個氣象屏 排名下滑很大。很詫異,以前排名一直很穩定靠前,怎麼現在就掉下去了?再看外鏈資料。發現罪魁禍首 外鏈的數量從昨天200...

為什麼不放小搜尋引擎們一條生路。

當web2.0和細搜們在中國的網路界開始有星火燎原之勢的時候,業界大老出來說 你們那點東西,我們分分鐘就可以做,而且做得比你好,分分鐘滅你。撇下霸道態度不論,他說的真的是事實 商場是戰場,不是上流社會的沙龍,大家不必講溫良恭儉讓那一套,在現時的社會上,主流的價值觀是承認實力,翻譯成普通話就是錢。我是...