Python jeba庫的使用

2021-10-04 11:44:41 字數 489 閱讀 1610

jieba是優秀的中文分詞第三方庫

-中文文字需要通過分詞獲得單個的詞語

-jieba需要額外安裝

-jieba庫提供了三種分詞模式,只需要掌握一種就能使用

ieba庫分詞依靠中文詞庫

-利用乙個中文詞庫,確定漢字之間的關聯概率

-漢字間概率大的組成的片語,形成分詞結果

-除了分詞,使用者還可以新增自定義的片語

安裝一定要在命令列介面

-pip install jieba

jieba分詞的三種模式

-精確模式:把文字精確的且分開,不存在冗餘單詞,結果還是原句,是最常用的模式

-全模式:把文字中所有可能的詞語都掃瞄出來,可能有冗餘

-搜尋引擎模式:在精確模式基礎上,對長詞再次切分,存在冗餘

jieba庫常用函式,如圖所示

靜態庫動態庫的使用

首先介紹一下靜態庫 靜態鏈結庫 動態庫 動態鏈結庫 的概念,首先兩者都是 共享的方式。靜態庫 在鏈結步驟中,聯結器將從庫檔案取得所需的 複製到生成的可執行檔案中,這種庫稱為靜態庫,其特點是可執行檔案中包含了庫 的乙份完整拷貝 缺點就是被多次使用就會有多份冗餘拷貝。即靜態庫中的指令都全部被直接包含在最...

Boost thread庫的使用

2009 11 26 kagula 閱讀物件 本文假設讀者有幾下skills 1 在c 中至少使用過一種多執行緒開發庫,有mutex和lock的概念。2 熟悉c 開發,在開發工具中,能夠編譯 設定boost thread庫。1 visual studio 2005 2008 with sp1 2 b...

Boost thread庫的使用

閱讀物件 本文假設讀者有幾下skills 1 在c 中至少使用過一種多執行緒開發庫,有mutex和lock的概念。2 熟悉c 開發,在開發工具中,能夠編譯 設定boost thread庫。1 visual studio 2005 2008 with sp1 2 boost1.39 1.40 通過例項...