標註工具迭代前後的效率差異的對比方法

2022-07-21 05:48:14 字數 943 閱讀 1206

資料標註是ai能力提公升的基礎,能夠高效、低成本地生產高質量資料,是ai公司以及ai上游產業的核心競爭力。其中研究標註工具迭代前後的效率差異,對評價迭代效果具有重要意義。

方法一在衡量標註效率時,有3個變數會影響我們的計算:有標客自身的效率差異(同一人隨著時間發展,效率會提高;不同人的標註效率不同);也有工具迭代帶來的效率提公升;還有工具的功能增加造成的標註時間延長。

我們要分析標註工具迭代帶來的效率變化,就要排除其他因素的影響,具體操作方法如下。

1、  保持受試物件相同。

2、  保持測試題目相同。

3、  保持受試物件對題目的熟練度相同:由於受試物件第一次做a任務,和第二次做a任務的熟練度有較大差異。而第二次和第三次做任務的熟練度差異相對較小。所以對比標註工具α版本和β版本的效率提公升幅度的恰當方法是:將第二次做任務(使用α版本工具)的效率,和第三次做任務(使用β版本工具)的效率進行對比。

4、  注:如果工具的迭代版本改變了標註方法,如本來只需要畫框標屬性,迭代版本新增了轉寫文字的功能,那麼標註的工作量勢必會增加。這種情況就不應該跟之前版本進行效率對比了,因為本質上是不同的標註方式了。此時仍然可以測算該版本的標註效率,但是應該以當前版本作為新的起點,對比後續迭代版本與當前版本的效率提公升值。

方法二由於方法一需要控制的變數很多,操作成本和耗時較長,所以對於時間和成本有要求的人可以嘗試第二種方法。第二種方法的思想是對於影響效率的變數僅作粗略的控制,不苛刻地要求其他變數一致。

1、  保持受試物件的標註能力平均分布:從現有標客團隊隨機抽取數量均等的a、b兩組標客。

2、  保持測試題目的難度平均分布:將同一批任務隨機分成檔案數量均等的兩組。

3、  將兩組任務分別在α版本和β版本的標註工具上建立任務,a、b兩組標客分別在兩種工具上完成標註任務。

統計a、b兩組,單位產量下的操作次數:統計點選、輸入、畫框、切分音訊等操作的次數,得數量m。m/總產量,求得的數值越小,說明標註工具的設計越合理。時,

標註工具 馬克鰻的使用

馬克鰻 英文名 markman 是國內開發的一款基於 adobe air 注 這款工具分為免費版和付費版,功能的差別自然不用多說。免費的能開啟一些基礎功能,付費需要60刀每年,價錢還算公道,付費版能開啟高階功能,多金的小夥伴可以嘗試,這裡只介紹免費版 使用方法 2.安裝,按照安裝導引安裝就行 3.啟...

標註工具 yarn的學習筆記

yarn是比npm更加先進的一種包管理工具 安裝的方法參考yarn的官網 2 installation yarn package manager 1.以管理員身份執行 powershell 2.設定指令碼執行策略 set executionpolicy remotesigned看到提示之後,選擇 y...

for迴圈用效率分析( 和 時效率的差異分析)

聽別人說的面試中問過的乙個問題,記不清了,如有偏差希望大家補充糾正 問題 完成相同的功能,for迴圈使用 和 哪個效率更高?通常我們在編寫需要for迴圈實現的程式時有兩種實現方法 for int i 0 ifor int i arr.length 1 i 0 i 結論 通常來講第2種用 的方法效率更...