搭建sphinx中文檢索引擎

2021-08-31 04:23:53 字數 2524 閱讀 1641

前一段在研究sphinx,檢索功能很強大,用的ubuntu,coreseek中文檢索

用root賬戶登入

1、ubuntu9.10需安裝軟體:

apt-get install gcc g++ automake libtool mysql-client libmysqlclient15-dev libxml2-dev libexpat1-dev

2、

download

tar xzvf coreseek-3.2.13.tar.gz

3、安裝mmseg中文分詞:

cd mmseg-3.2.13

./bootstrap

##ubuntu環境下,需要使用aclocal_flags="-i /usr/share/aclocal" ./bootstrap

./configure --prefix=/usr/local/mmseg3

make

make install

檢測安裝:

/usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc src/t1.txt

中文/x 分/x 詞/x 測試/x

中國人/x 上海市/x

word splite took: 1 ms.

4、安裝coreseek(mysql資料來源):

cd csft-3.2.13

sh buildconf.sh

apt-get install mysql-client libmysqlclient15-dev libxml2-dev libexpat1-dev

./configure --prefix=/usr/local/coreseek --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql

make

make install

5、測試安裝:

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx-min.conf.dist

6、建立全索引:

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --all

搜尋:

/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/csft.con

f

開啟searchd埠監控:

/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf

關閉埠:

/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf --stop

重建索引

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --all --rotate

建立指定配置檔案中指定索引

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf index1 --rotate

7、配置中文分詞

生成詞典:

cp ~/mmseg3/data/ /usr/local/mmseg/ -r

/usr/local/mmseg3/bin/mmseg -u unigram.txt

cp unigram.txt.uni uni.lib

修改索引配置:

charset_dictpath=/usr/local/mmseg3/etc/

charset_type=zh_cn.utf-8

重建索引加入cron任務,

建立增量索引,

配置檔案等等

再續..

全文檢索引擎 Sphinx

sphinx是乙個基於sql的全文檢索引擎,可以結合mysql,postgresql做全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得應用程式更容易實現專業化的全文檢索。sphinx特別為一些指令碼語言設計搜尋api介面,如php,python,perl,ruby等,同時為mysql也設計了乙...

全文檢索引擎 Sphinx

sphinx是乙個基於sql的全文檢索引擎,可以結合mysql,postgresql做全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得應用程式更容易實現專業化的全文檢索。sphinx特別為一些指令碼語言設計搜尋api介面,如php,python,perl,ruby等,同時為mysql也設計了乙...

sphinx中文索引實現中文檢索

介紹 2 sphinx使用的好處 快速檢索使用者需要的模糊資訊 替代like使用 本身還有中文 分詞 的實現,英文分詞通過 空格 區分,中文分詞通過技術實現 例如 匹配 使用習慣 sphinx是專業做資料檢索的乙個技術使用者去sphinx做模糊查詢,查詢 北京 相關的資訊,sphinx把 北京西二旗...