曼孚科技丨為什麼印度是資料標註服務的熱點?

2022-09-19 02:21:07 字數 1367 閱讀 1890

人工智慧行業有句話:有多少智慧型,背後就有多少人工。隨著大資料、雲計算和人工智慧等技術飛速發展,資料標註服務逐漸走入人們視野,成為新形勢下商業價值凸顯的重要抓手。

資料標註就是機器學習的過程,資料標註員使用自動化的工具從網際網路上抓取、收集資料報括文字、、語音等等,並對抓取的資料進行整理與標註, 他們的工作是教會ai認識資料,依據這些大量而有效的資料總結規律,教導ai像人一樣去感知、思考和決策,最終形成自己的工作模式,更好地為人類服務。

行業背景

乙個演算法經過越多資料的訓練,它的精確度就越高,換言之,ai行業將一直需要更多準確註解與標註的資料。如今全球巨頭企業紛紛發展人工智慧,2023年全球資料標註工具市場已達4940億美元,預計2023年至2023年將以27.1%的復合年增長率(cagr)增長。其快速更迭的主要動力來自於影象資料標註的日益普及,根據標註型別,市場上主要分為手動、半監督和自動三種,其中手動資料標註最受歡迎,因為它具備準確性、完整性及關聯性優勢,可以更好的整合至演算法中,為汽車、零售、醫療保健與金融等領域提供資料支援。

印度市場

標記訓練資料集是一項複雜、耗時且需要大量勞力的繁瑣工作,印度作為世界排名第二的人口大國,為資料標註提供了乙個龐大的人才庫,該國科技行業的外包熱潮使其成為這種精密工作發展的溫床。印度軟體與服務業企業協會(nasscom)高階副總裁兼首席戰略官sangeeta gupta表示:「在印度,這算是乙個新興的行業……大家漸漸意識到這一行業即將開啟的巨大機遇。人工智慧需要借助於被正確註解、分類和進行匿名處理的資料。在這件事上,無論人們觀念如何,除了自動化手段以外,嫻熟的工人同樣必不可少,這便是印度的機遇。」

轉型之路

open text產品營銷高階總監lori mc kellar認為:「在這個日益數位化的世界中,印度的人員和技能將成為多年的關鍵資源。」在經歷世紀之交業務流程外包的熱潮之後,越來越多用來訓練人工智慧的資料集被打上了「企業專有權」的標籤,印度人對這些企業的需求和所用術語並不陌生。和業務流程外包類似,資料標注重在對工作流程的管理,其所需技能即使是高中學歷的人也可以通過訓練掌握,這種低薪+低技能的工作,使擁有同等條件的羅馬尼亞、印度尼西亞、越南、菲律賓等其他發展中經濟體也將有機會跟進並加入這一領域。

因此想在標註市場保持領先地位,企業和資料標註團隊在需求、質量控制、反饋和成果交付方面的互動應更加緊密,正如cranberry首席執行官兼創始人shishir thakur所言:「只有通過為高複雜性和中高水平技術能力的人工智慧服務才是我們不被取代的出路。」

資料標註,自動駕駛汽車的新「引擎」丨曼孚科技

伴隨著計算機視覺技術的日臻成熟,出行生態不斷智慧型化,這其中典型的應用場景就是汽車自動駕駛。1.汽車自動駕駛真的來了 2018年,世界上首個無人計程車正式上路。這是矽谷初創公司 drive.ai 在美國德克薩斯州 frisco 實現的第一批無人計程車出行。如果算上滴滴年底在上海推出自動駕駛計程車的計...

資料標註,自動駕駛汽車的新「引擎」丨曼孚科技

伴隨著計算機視覺技術lensev的日臻成熟,出行生態不斷智慧型化,這其中典型的應用場景就是汽車自動駕駛。一 汽車自動駕駛真的來了 2018 年,世界上首個無人計程車正式上路。這是矽谷初創公司 drive.ai 在美國德克薩斯州 frisco 實現的第一批無人計程車出行。國內領域,是汽車自動駕駛行業的...

資料標註員 人工智慧行業的「築夢師」丨曼孚科技

資料標註行業裡有著這樣的一段話 有多少智慧型,就有多少人工 這句話在某種程度上道出了人工智慧的本質。事實上,現階段提公升ai認知世界能力的最有效途徑仍然是監督學習,而監督學習下的深度學習演算法訓練十分依賴於資料標註員進行標註資料。可以說,如果資料標註是人工智慧行業的基石,那麼資料標註員就是資料標註行...