ubuntu配置ctpn 文字檢測

2021-09-13 14:48:17 字數 1070 閱讀 5885

我是在ubuntu14.04系統下進行的操作。

這個工程是基於tensorflow的,所以,首先要確保安裝了tensorflow。tensorflow的安裝很簡單,直接使用pip安裝即可。

pip install tensorflow
檢驗安裝是否成功

import tensorflow as tf
不報錯就是安裝成功了。

這裡簡單的敘述一下步驟,具體的請到原文**檢視

然後執行demo

python ./main/demo.py
由於我真的是渣渣,python我也不懂,所以執行了這步操作,結果就是報錯no model named nets

就是demo.py檔案中的**報錯

from nets import model_train as model

from utils.rpn_msr.proposal_layer import proposal_layer

from utils.text_connector.detectors import textdetector

from    import
是python中用來匯入模組的,我們的nets是個資料夾,不能直接當做python的模組,需要在該檔案下新增乙個名為__init__.py的空檔案。__init__.py 檔案的作用是將資料夾變為乙個python模組,python 中的每個模組的包中,都有__init__.py 檔案。

python __init__.py 作用詳解

這樣根據提示錯誤,在nets、utils等資料夾下新增該檔案,就可以成功執行。

但是提供的5張的**,只有兩張能執行成功,目前還不知道原因是什麼。。

文字檢測 CTPN

參考 faster rcnn 非常詳盡 零基礎入門深度學習 5 迴圈神經網路 零基礎入門深度學習 6 長短時記憶網路 lstm 文章基本資訊 題目 detecting text in natural image with connectionist text proposal network,簡稱c...

OCR文字檢測模型 CTPN

乙個簡單的文字識別流程如下 step 1.通過手機 攝像機 掃瞄器等裝置採集含有待識別字元的影象,作為輸入 step 2.對影象進行尺寸縮放 明暗調整 去噪等預處理操作 step 3.將影象中的單個字元 或者是連續幾個字元所在的區域檢測出來 step 4.根據文字檢測結果從影象中將文字所在區域分割出...

文字檢測模型之CTPN

思路將文字定位框拆分成乙個個等寬 中為16 的小文字框,然後只需在y方向上做回歸。這裡仍然使用了rpn 可看faster rcnn 唯一不同的是這裡得到的候選區域 region proposal 是乙個等寬不等高的。這種小文字框也規避了網路感受野不足的問題。使用了cnn rnn的組合,這裡加入rnn...