SCWS中文分詞PHP擴充套件詳細安裝說明

2022-07-13 03:39:09 字數 1173 閱讀 6346

因最近寫的一段**,需要用到中文分詞,在網上找了一下,發現了scws這個不錯的外掛程式,故根據文件安裝使用,下面記錄下安裝的全過程

系統:centos

wget 

tar xvjf scws-1.2.3.tar.bz2

cd scws-1.2.3

./configure --prefix=/usr/local/scws

make

make install

cd /usr/local/scws/etc

wget 

wget 

tar xvjf scws-dict-chs-gbk.tar.bz2

tar xvjf scws-dict-chs-utf8.tar.bz2

cd ~/scws-1.2.3

cd phpext

/www/server/php/56/bin/phpize(這裡的配置按照實際的php位址配置,這裡是寶塔面板環境下的位址)

./configure --with-scws=/usr/local/scws --with-php-config=/www/server/php/56/bin/php-config(這裡的配置按照實際配置,這裡是寶塔面板環境下的位址)

make

make install

[scws]

;; 注意請檢查 php.ini 中的 extension_dir 的設定值是否正確, 否則請將 extension_dir 設為空,

; 再把 extension = scws.so 指定絕對路徑。

;extension = scws.so

scws.default.charset = gbk

scws.default.fpath = /usr/local/scws/etc

儲存後重新啟動php環境

<?php

$so = scws_new();

$so->set_charset('gbk');

// 這裡沒有呼叫 set_dict 和 set_rule 系統會自動試呼叫 ini 中指定路徑下的詞典和規則檔案

$so->send_text("小姐姐,我喜歡你,做我女朋友吧!");

while ($tmp = $so->get_result())

$so->close();

?>

PHP中文分詞擴充套件 SCWS

1 scws簡介 scws 是 chinese word segmentation 的首字母縮寫 即 簡易中文分詞系統 這是一套基於詞頻詞典的機械式中文分詞引擎,它能將一整段的中文文字基本正確地切分成詞。詞是中文的最小語素單位,但在書寫時並不像英語會在詞之間用空格分開,所以如何準確並快速分詞一直是中...

php 分詞擴充套件 scws

官方 以 linux freebsd 作業系統為例 1.取得 scws 1.2.2 的 wget 2.解開壓縮包 hightman d1 tar xvjf scws 1.2.2.tar.bz2 3.進入目錄執行配置指令碼和編譯 hightman d1 cd scws 1.2.2 hightman d...

編譯PHP的SCWS中文分詞擴充套件

scws 是 chinese words segmentation 的縮寫,即簡易中文分詞系統。版本號 1.1.3 2 執行 phpize 在php安裝目錄的bin 目錄下 還是在剛剛提到的那個目錄下執行phpize,不要跳出去 3 執行 configure with scws usr local ...