全文檢索引擎 Sphinx

2021-09-01 21:22:46 字數 720 閱讀 2931

sphinx是乙個基於sql的全文檢索引擎,可以結合mysql,postgresql做全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得應用程式更容易實現專業化的全文檢索。sphinx特別為一些指令碼語言設計搜尋api介面,如php,python,perl,ruby等,同時為mysql也設計了乙個儲存引擎外掛程式。

sphinx 單一索引最大可包含1億條記錄,在1千萬條記錄情況下的查詢速度為0.x秒(毫秒級)。sphinx建立索引的速度為:建立100萬條記錄的索引只需 3~4分鐘,建立1000萬條記錄的索引可以在50分鐘內完成,而只包含最新10萬條記錄的增量索引,重建一次只需幾十秒。

sphinx的主要特性包括:

高速索引 (在**cpu上,近10 mb/秒);

高速搜尋 (2-4g的文字量中平均查詢速度不到0.1秒);

高可用性 (單cpu上最大可支援100 gb的文字,100m文件);

提供良好的相關性排名

支援分布式搜尋;

提供文件摘要生成;

提供從mysql內部的外掛程式式儲存引擎上搜尋

支援布林,短語, 和近義詞查詢;

支援每個文件多個全文檢索域(預設最大32個);

支援每個文件多屬性;

支援斷詞;

支援單位元組編碼與utf-8編碼;

全文檢索引擎 Sphinx

sphinx是乙個基於sql的全文檢索引擎,可以結合mysql,postgresql做全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得應用程式更容易實現專業化的全文檢索。sphinx特別為一些指令碼語言設計搜尋api介面,如php,python,perl,ruby等,同時為mysql也設計了乙...

Sphinx(一種全文檢索引擎)

簡介編輯 sphinx是乙個基於sql的 全文檢索引擎,可以結合mysql,postgresql做 全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得 應用程式更容易實現專業化的全文檢索。sphinx特別為一些 指令碼語言設計搜尋api介面,如php,python,perl,ruby等,同時為m...

mysql ngram全文檢索引擎

中的內容視作乙個短語 整體 3.查詢 已經存在表 against select from articles where match title,body against 文言文 innatural language mode 不指定模式,預設使用自然語言模式 select from articles...