Linux下安裝tesseract教程

2021-10-13 08:51:49 字數 4608 閱讀 1265

一、依賴安裝:

1、檢視centos版本

#cat /etc/redhat-release

centos release 6.5 (final)

2、檢查yum的repo庫

#yum repolist all

檢查是否有如下的repo庫:

centos-sclo-rh,centos-sclo-sclo

如果沒有則安裝:

#yum -y install centos-release-scl-rh centos-release-scl

3、檢查gcc和g++版本

#gcc --version

#g++ --version

gcc的當前版本編譯tesseract4.1會出錯,需要gcc更高的版本,通過yum安裝的6.3.1版本,通過yum安裝gcc有如下好處:

1) 安裝方便,特別是很多依賴的軟體包自動安裝;

2) gcc的版本可以靈活切換,老的版本得以保留。

4、安裝gcc 6.3.1

#yum -y install devtoolset-6-gcc devtoolset-6-gcc-c++

執行如下命令使gcc6立即生效

#source /opt/rh/devtoolset-6/enable

再次檢視gcc和g++版本

#gcc --version

#g++ --version

如需永久生效則需要把命令新增到/etc/profile檔案

vim /etc/profile

在最後新增如下內容:

source /opt/rh/devtoolset-6/enable

執行如下命令使之立即生效

#source /etc/profile

5、安裝依賴庫(可以下面再裝)

#yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel

6、安裝autoconf

檢視本地的autoconf版本,如果過低則移除

#rpm -qa | grep autoconf

#rpm -e --nodeps autoconf-2.63

獲得2.69版本autoconf

#wget

#tar xzvf autoconf-2.69.tar.gz

#cd autoconf-2.69

編譯並安裝

#./configure

#make

#make install

檢查一下autoconf是否是2.69版本

#autoconf --version

7、安裝autoconf-archive

現在安裝的是2018.03.13版本,當然要選擇高一些的版本啦

#wget

#xz -d autoconf-archive-2018.03.13.tar.xz

#tar xvf autoconf-archive-2018.03.13.tar

#cd autoconf-archive-2018.03.13

編譯並安裝

#./configure

#make

#make install

最後一步很關鍵,必須把m4目錄下的檔案複製到/usr/share/aclocal/目錄下,這些命令後面編譯tesseract用得到,否則後面編譯tesseract的時候會報command not found錯誤

#cp ./m4/* /usr/share/aclocal/

2.安裝依賴

安裝依賴:yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel

3.安裝leptonica

tar -xzvf leptonica-1.74.4.tar.gz

cd leptonica-1.74.4.tar.gz

./configure --prefix=/usr/local/leptonica

make

sudo make install 或make install

4.配置leptonica環境變數

vim /etc/profile

新增以下字段:

pkg_config_path=$pkg_config_path:/usr/local/leptonica/lib/pkgconfig

export pkg_config_path

cplus_include_path=$cplus_include_path:/usr/local/leptonica/include/leptonica

export cplus_include_path

c_include_path=$c_include_path:/usr/local/leptonica/include/leptonica

export c_include_path

ld_library_path=$ld_library_path:/usr/local/leptonica/lib

export ld_library_path

library_path=$library_path:/usr/local/leptonica/lib

export library_path

liblept_headersdir=/usr/local/leptonica/include/leptonica

export liblept_headersdir

重新整理配置:

source /etc/profile

5.安裝tesseract

tar -xzvf 4.1.0.tar.gz

cd tesseract-4.1.0

./autogen.sh

./configure --prefix=/usr/local/tesseract

make

sudo make install 或make install

6.配置 tesseract 環境變數

vim /etc/profile

新增以下字段:

path=$path:/usr/local/tesseract/bin

export path

重新整理配置

source /etc/profile

7.安裝完畢檢視tesseract版本

tesseract --version

可執行檔案路徑:

#which tesseract

/usr/local/bin/tesseract

語言包的路徑(目前空空如也):

/usr/local/share/tessdata

看名稱就很容易理解,前者為英文,後兩個為簡體中文,把這些語言包放到/usr/local/share/tessdata目錄下

11、初體驗tesseract識別

下面簡單介紹一下常用的引數

-l引數表示要用的語言包,chi_sim表示簡體中文語言包,預設為英文;

0 = orientation and script detection (osd) only.

1 = automatic page segmentation with osd.

2 = automatic page segmentation, but no osd, or ocr.

3 = fully automatic page segmentation, but no osd. (default)

4 = assume a single column of text of variable sizes.

5 = assume a single uniform block of vertically aligned text.

6 = assume a single uniform block of text.

7 = treat the image as a single text line.

8 = treat the image as a single word.

9 = treat the image as a single word in a circle.

10 = treat the image as a single character.

三、注意事項:

1.如果解析度和gpi不符合要求會返回警告:

tesseract open source ocr engine v4.1.0 with leptonica

warning: invalid resolution 0 dpi. using 70 instead.

解決辦法:修改gpi和解析度,參照測試test_picture3.jpg

五、參考資料

Linux下Redis下安裝

redis安裝 檢查是否安裝redis ps ef grep redis2.檢查gcc服務是否安裝成功 rpm qa grep gcc注 安裝成功則顯示 mkdir redis5.解壓redis安裝包 tar zxvf redis 2.8.17 tar.gz c usr local redis 解壓...

Linux下安裝安裝arm linux gcc

1 tar指令解壓對應壓縮包到指定目錄,如arm linux gcc 4.3.2.tar.bz2壓縮包,sudo tar xvjf arm linux gcc 4.3.2.tar.bz2 c tar壓縮解壓縮 c 建立打包檔案,可搭配 v來觀察過程中被打包的檔名 filename t 檢視打包檔案的...

linux下安裝軟體

linux下安裝軟體有兩種方式 備註 linux 上面一般安裝 redhat 的rpm 包,在ubuntu 上一般安裝 deb的包 首先是rpm包的安裝教程 一是安裝二進位制的包,一般都是 rpm格式的了,常用 rpm ivh rpm 的方式來安裝了 rpm qa rpm命令。rpm安裝有時遇到依賴...