Ubuntu安裝使用kenlm

2021-10-04 04:30:51 字數 1603 閱讀 1642

最近接觸的都是深度學習那一套,有些…來乙個最*****但效果其實並不差的統計模型

也是不錯的。(說實話真心覺得模型背後強大的數學理論、資訊理論真的牛。各種各變體的基於深度學習的重構/自編解碼的根基不都是建立在其上嗎~~~來自乙個深度學習(使用深度學習作為工具)小白的拙見)

獲取安裝包

wget -o -  |

tar xz

建立目錄

mkdir kenlm/build
進入目錄

cd kenlm/build
安裝

cmake ..

make -j2

注:

需要額外安裝cmake

sudo

apt-get

install cmake

如果make出錯(我這裡沒有記錄了,大概有這種錯誤:make: *** 沒有指明目標並且找不到 makefile。 停止),根據具體情況,可能需要安裝gcc或boost

sudo

apt-get

install gcc

or

sudo

apt-get

install build-essential

sudo

apt-get

install libboost-all-dev

訓練指定語言模型

build/bin/lmplz -o 5  text.arpa
示例:

build/bin/lmplz -o 3 --verbose_header --text /home/zhutingting/people2014_words.txt --arpa /home/zhutingting/result/people2014corpus_words.arps

(1). -o 3 代表使用3ngram

(2). 待訓練的檔案必須是分詞以後的檔案(如果粒度在字上就是空格隔開的字)

壓縮訓練得到的檔案

build/bin/build_binary text.arpa text.klm
示例:

build/bin/build_binary /home/zhutingting/result/people2014corpus_words.arps /home/zhutingting/result/people2014corpus_words.klm
kenlm官網

使用kenlm模型判別a/an錯別字

使用kenlm工具訓練統計語言模型

linux/ubuntu install boost

Ubuntu使用 Scim安裝

scim安裝 apt get install scim 然後安裝字型檔,輸入法 apt get install scim chinese 就可以使用智慧型拼音輸入法了!當然在使用之前還要先配置一下,配置方法很簡單,在 etc x11 xsession.d 裡新建乙個名叫95xinput的檔案,檔案內...

Ubuntu安裝使用SSH

ubuntu安裝使用ssh 1.ssh localhost 2.ssh connect to host localhost port 22 connection refused 如上所示,表示沒有還沒有安裝,可以通過apt安裝,命令如下 1.sudo apt get install openssh ...

ubuntu安裝使用問題

1.開機後怎麼進入圖形介面?答 開啟ubuntu後最先進入的是控制台,先使用者登入,然後輸入 startx 回車,進入圖形介面。2.從圖形介面進入控制台 答 從左側工具欄中的dash home 中搜尋 終端 terminal 開啟終端,即可進入控制台。快捷鍵 ctrl alt t 3.ubuntu ...