騰訊Ocr文字識別

2021-09-11 17:13:18 字數 3334 閱讀 9948

implementation 'com.qcloud:qcloud-image-sdk:2.3.6'
初始化識別程式:

imageclient.new_domain_recognition_image_myqcloud_com);

imageclient.new_domain_recognition_image_myqcloud_com
如果是老使用者,修改為以下網域名稱:

imageclient.old_domain_service_image_myqcloud_com
開始進行文字識別:

generalocrrequest request = new generalocrrequest("", getbitmapfile(mbitmap));

try catch (abstractimageexception e)

generalocrrequest的第乙個引數是bucketname實際上沒什麼用(官方說是遺留字段,至少對我來說沒什麼用,不知道實際上是什麼樣子),可以直接用空字元填充,第二個引數是file,上面**是我專案中從bitmap獲取file檔案的寫法。**中的orcresult即為文字識別結果,返回的是一段json資料,需要自己去轉換,推薦使用fastjson框架。

本專案中使用的是okhttp3框架進行get-post操作,因此是okhttp3框架的**寫法,實際使用因框架的不同而不同,但傳送的資料都一樣。如果要識別的是乙個url位址,則用以下的post資料形式:

authorization: 自己生成簽名

host: recognition.image.myqcloud.com

content-length: 自定義長度 ps:有使用者稱加上這個會報錯,本人使用的時候是不加上content-length的

authorization: 自己生成簽名

host: recognition.image.myqcloud.com

content-length: 自定義長度 ps:同上

content-type: multipart/form-data;boundary=--------------acebdf13572468

----------------acebdf13572468

----------------acebdf13572468

content-disposition: form-data; name="bucket";

空串----------------acebdf13572468

----------------acebdf13572468--上面這些資料讓不懂multipart/form-data格式的童鞋來說,看上去就眼花繚亂,不知道該怎麼用,但是不要緊,實際上我們根本不需要寫這麼多東西,這就是使用http框架的好處,它已經幫我們做了很多事。

2. 首先需要自己生成簽名:

public class sign 

/*** 生成 base64 編碼

** @param binarydata

* @return

*/public static string base64encode(byte binarydata)

/*** 生成 hmacsha1 簽名

** @param binarydata

* @param key

* @return

* @throws exception

*/public static byte hmacsha1(byte binarydata, string key) throws exception

/*** 生成 hmacsha1 簽名

** @param plaintext

* @param key

* @return

* @throws exception

*/public static byte hmacsha1(string plaintext, string key) throws exception

}

string sign = "";

try catch (exception e)

請求頭和請求體:

.build();重點要注意第乙個addformdatapart方法,第乙個引數是「image」無需改動,第二個引數是檔案的路徑,第三個引數是檔案的型別,第四個引數就是file本身。其他的設定項都是預設的,不需要修改。

4. 開始post並返回結果:

});返回的結果也是json資料體,需要自己解析。

ocr文字識別功能

工作中,我們經常會碰到要將型別的文字或文件進行數位化錄入,因此類文件無法直接複製或編輯,便需要人工手動進行輸入,不僅耗時費力 出錯率高且對於企業而言,人力成本高 在人工智慧應用較為普遍的現在,ocr文字識別技術脫穎而出,幫助人們擺脫了手動輸入的繁瑣,提公升了工作效率。應對市場需求與技術的不斷進步,依...

OCR文字識別HTTP restapi介面設計

是通過http 的boundary的方式新增.很標準的格式但是感覺還是不夠簡潔,上面的格式拼起來比較累 我們設計的api如下將使用者需要傳遞的字段拼成k v格式的字串 key2 value1 key2 value2 image imagedata 其中imagedata為的二進位制進行base64編...

OCR文字識別SDK應用

ocr識別技術現已相當的成熟,故其應用也變得普遍起來。今天以ocr sdk為例,詳細了解下其應用場景。我們的ocr sdk可以提供api介面,方便整合掛接,且效果良好。比如,ocr sdk可以用於檔案管理系統,oa系統等。下面就來看下oa系統中的ocr sdk作用。現在ocr sdk已經被應用在oa...