python tesserocr 包的安裝

2021-09-11 20:38:20 字數 3688 閱讀 1170

ocr(optical character recognition) 光學字元識別

tesserocr 是python的乙個ocr 識別庫,但其實是對tesseract 做的一層python api封裝,所以它的核心是tesseract.

因此安裝tesserocr 之前,我們需要安裝tesseract.

簡體字識別包:

繁體字識別包:

安裝tesseract

其中檔名中帶有dev 的為開發版本,不帶dev 的為穩定版本,可以選擇不帶dev 的版本。

選中 additional language data ,可以支援多國語言。

安裝tesserocr

pip3 install tesserocr pillow
發現安裝失敗:

\\temp\\pip-install-hu3gfkjz\\tesserocr\\setup.py';f=getattr(tokenize, 'open', open)(__file__);code=f.read().replace('\r\n', '\n');f.close();exec(compile(code,

這時pip安裝就不是正確選擇,還可以使用whl檔案進行安裝

檢視python對應的whl檔案版本

cmd中輸入:python

>>>import pip

>>>import pip._internal

>>>print(pip._internal.pep425tags.get_supported())

可以看到支援的版本:

[('cp36', 'cp36m', 'win_amd64'), ('cp36', 'none', 'win_amd64'), ('py3', 'none', 'win_amd64'), ('cp36', 'none', 'any'), ('cp3', 'none', 'any'), ('py36', 'none', 'any'), ('py3', 'none', 'any'), ('py35', 'none', 'any'), ('py34', 'none', 'any'), ('py33', 'none', 'any'), ('py32', 'none', 'any'), ('py31', 'none', 'any'), ('py30', 'none', 'any')]

>>>

支援的版本:『cp36', 'cp36m', 'win_amd64'

如果安裝的版本不對:

會報如下錯誤:

requirement 'tesserocr-2.3.1-cp37-cp37m-win_amd64.whl' looks like a filename, but the file does not exist

tesserocr-2.3.1-cp37-cp37m-win_amd64.whl is not a supported wheel on this platform.

選擇對應的版本並安裝:

(檢視python 的安裝目錄:

import sys

sys.path

結果:['', 'c:\\python27\\lib\\idlelib', 'c:\\python27\\lib\\site-packages\\robotframework_selenium2library-1.5.0-py2.7.egg', 'c:\\python27\\lib\\site-packages\\docutils-0.14-py2.7.egg', 'c:\\python27\\lib\\site-packages\\decorator-4.2.1-py2.7.egg', 'c:\\windows\\system32\\python27.zip', 'c:\\python27\\dlls', 'c:\\python27\\lib', 'c:\\python27\\lib\\plat-win', 'c:\\python27\\lib\\lib-tk', 'c:\\python27', 'c:\\python27\\lib\\site-packages', 'c:\\python27\\lib\\site-packages\\win32', 'c:\\python27\\lib\\site-packages\\win32\\lib', 'c:\\python27\\lib\\site-packages\\pythonwin', 'c:\\python27\\lib\\site-packages\\wx-2.8-msw-unicode']

還需要安裝:

pip install pillow
測試是否安裝成功:

報錯:

traceback (most recent call last):

file "d:/mymodule/checkcode/checktest.py", line 5, in result = tesserocr.image_to_text(image)

file "tesserocr.pyx", line 2443, in tesserocr._tesserocr.image_to_text

解決方案: 

拷貝tessdata/ 到報錯的目錄下:

linux 下安裝:

sudo apt-get install -y tesseract-ocr libtesseract-dev libleptonica-dev
yum install -y tesseract
檢視支援的語言:

tesseract --list-langs
ubuntu

git clone 

sudo mv tessdata/* /usr/share/tesseract-ocr/tessdata

centos

git clone 

sudo mv tessdata/* /usr/share/tesseract/tessdata

tesseract --list-langs

結果如下:

接下來安裝tesserocr 即可,這裡直接使用 pip 安裝:

pip3 install tesserocr pillow

安裝完成!!!!

android google GMS服務包安裝

gms google mobile service 要想使用google服務,必須要安裝google mobile service,也就是通常所說的gms包,網上有很多做好了的gms包,可以通過recovery的方式刷進去,不過大多數都是別人做好的,有些功能並不是我們想要的,所以我們可以自己做乙個g...

安卓 改包名

現將project選單下的 build automatically 去掉,先不讓它同步的編譯,等一下統一的去編譯。選中我們需要更改的包 右擊 refactor rename,出現下面的介面,選中前面三個選項 選中preview,出現下圖的介面 ok即可 現在可以clean一下我們的專案了 選中專案名...

iperf 安卓 灌包命令 iperf灌包

版本 官方更新的最新版本為 1.7 打包在 jperf 不過在網路上找 到了移植版本 iperf2.5 iperf 還有乙個圖形介面程式叫做 jperf 使用jperf 程式能簡化了複雜命令列引數的構造,而且它還儲存測試結果 同時實時圖形化顯 示結果。當然,jperf 可以測試 tcp和 udp頻寬...