php 中文分詞類庫 簡易版

2021-08-26 17:55:02 字數 1142 閱讀 6584

現在 中文分詞現在都是用 scws 或者 sphinx 這種來分詞了

而我只是想分個文章或者小標題 想找個簡單的分詞就一直找不到; 無奈之下找到乙個不出名的類庫 自己稍加修改 就做好了分詞;

現在進入正文;

現在來到控制器載入個方法

/**

* 關鍵字提取方法

**@param $title string

* 進行分詞的標題

*@param $content string

* 進行分詞的內容

*/public

static

function

getkeywords

($title = "", $content = "")

if (empty ( $content ))

$data = $title . $title . $title . $title; // 為了增加title的權重,這裡連線4次

$pa=new \biz\count\phpanalysis(); //例項化

$pa->loaddict ();

$pa->setsource ( $data );

$pa->startanalysis ( true );

$tags = $pa->getfinallykeywords ( 2 ); // 獲取文章中的3個關鍵字,想要幾個就寫幾個就行

return

$tagsarr;//返回關鍵字陣列

}

就直接呼叫此方法就行了;

$flabelre

=$this

->getkeywords($title,$content); //直接呼叫方法 就返回陣列了

看下效果

$title="金融危機重創東南亞,泰國、馬來西亞、菲律賓、印度尼西亞等國損失慘重";

備註:要是沒有呼叫到詞典是會報錯或者分詞不准哦;要把路徑填清楚;例項化成功後進loaddict方法去var_dump一下字典就可以知道有沒有應用成功了 只要路徑都是正確的就可以用了

乙個很好的php分詞類庫 SCWS

一位推薦了scws分詞系統,看著挺不錯,在這裡記一下。最近做實驗,苦於php分詞的問題,從網上找了很多,但都不行,導致試驗結果不是很好,今天早晨抱著不放棄的努力,又試著重網上找開源的php分詞詞庫,終於功夫不負有心人。發現了乙個很好的分詞類庫phpanalysis2.0。phpanalysis類ap...

scws簡易中文分詞系統

一 簡介 scws 是 chinese words segmentation 的縮寫,即簡易中文分詞系統。這是一套基於詞頻詞典的機械中文分詞引擎,它能將一整段的漢字基本正確的切分成詞。詞是漢語的基本語素單位,而書寫的時候不像英語會在詞之間用空格分開,所以如何準確而又快速的分詞一直是中文分詞的攻關難點...

mysql 中文分詞搜尋 php中文分詞搜尋

本篇文章主要介紹php中文分詞搜尋,感興趣的朋友參考下,希望對大家有所幫助。2 php.ini 中配置 extension php scws.dll scws.default.charset utf8 配置預設的編碼方式 scws.default.fpath e wamp scws 加壓後檔案的路徑...