SCWS分詞擴充套件在WINDOWS下的安裝方法

2021-09-07 01:27:11 字數 1446 閱讀 7556

安裝之前先確認您是否擁有主機的安裝許可權,否則無法進行安裝,安裝步驟如下:

ext/ 目錄中去(通常為:x:/php/ext/)。

3. 建立乙個本地目錄放規則集檔案和詞典檔案,建議使用:c:/program files/scws/etc

5. 修改 php.ini 通常位於 c:/windows/php.ini 或 c:/winnt/php.ini 之類的目錄,

在 php.ini 的末尾加入以下幾行:

[scws]

;; 注意請檢查 php.ini 中的 extension_dir 的設定值是否正確, 否則請將 extension_dir 設為空,

; 再把 php_scws.dll 指定為絕對路徑。

;extension = php_scws.dll

以下引數可選

scws.default.charset = gbk

scws.default.fpath = "c:/program files/scws/etc"

6. 重啟 web 伺服器即可完成。

測試程式:

test1.php

<?php

$so = scws_new();

$so->set_charset('gbk');

// 這裡沒有呼叫 set_dict 和 set_rule 系統會自動試呼叫 ini 中指定路徑下的詞典和規則檔案

$so->send_text("我是乙個中國人,我會c++語言,我也有很多t恤衣服");

while ($tmp = $so->get_result())

$so->close();

?>

test2.php

<?php

//例項化分詞外掛程式核心類

$so = scws_new();

//設定分詞時所用編碼

$so->set_charset('utf-8');

//設定分詞所用詞典(此處使用utf8的詞典)

$so->set_dict('dict.utf8.xdb');

//設定分詞所用規則

$so->set_rule('etc/rules.utf8.ini ');

//分詞前去掉標點符號

$so->set_ignore(true);

//是否複式分割,如「中國人」返回「中國+人+中國人」三個詞。

$so->set_multi(true);

//設定將文字自動以二字分詞法聚合

$so->set_duality(true);

//要進行分詞的語句

$so->send_text("我是中國人,我不喜歡吃喝玩樂");

//獲取分詞結果,如果提取高頻詞用get_tops方法

//    $tmp = $so->get_tops(5,'al,n');

while ($tmp = $so->get_result())

$so->close();

php 分詞擴充套件 scws

官方 以 linux freebsd 作業系統為例 1.取得 scws 1.2.2 的 wget 2.解開壓縮包 hightman d1 tar xvjf scws 1.2.2.tar.bz2 3.進入目錄執行配置指令碼和編譯 hightman d1 cd scws 1.2.2 hightman d...

PHP中文分詞擴充套件 SCWS

1 scws簡介 scws 是 chinese word segmentation 的首字母縮寫 即 簡易中文分詞系統 這是一套基於詞頻詞典的機械式中文分詞引擎,它能將一整段的中文文字基本正確地切分成詞。詞是中文的最小語素單位,但在書寫時並不像英語會在詞之間用空格分開,所以如何準確並快速分詞一直是中...

php中文分詞擴充套件scws在lnmp下的安裝

1.取得 scws 1.2.3 的 wget 2.解壓縮包 tar xvjf scws 1.2.3.tar.bz2 3.進入目錄配置和編譯 cd scws 1.2.3 configure prefix usr local scws make make install usr local scws b...