為什麼人工智慧工程師被戲稱為「調參俠」?

2021-10-03 11:51:29 字數 1362 閱讀 2406

確實,現在做人工智慧方向的工程師,有不少被稱為「調參俠」,但也並不全是。

以我自己為例,我做cv方向(計算機視覺)的, 調參在我日常工作中佔的比例並不大。

在cv這塊,除了超引數外,影響模型效果的主要還是要網路結構、資料和損失函式,這三方面確定下來後,調參基本花不了多少時間。

回歸正題!

在人工智慧裡面,引數大致可分為2大類:

引數(parameters)/模型引數:由模型通過學習得到的變數,比如權重w和偏置b,這個多半是不能調節的,它是由神經網路自己學習出來的。

超引數:在機器學習中,超引數是在神經網路訓練之前設定值的引數,而不是通過訓練得到的引數資料。常見的有學習率、迭代次數、隱藏層的層數、每層神經元的個數等。通常情況下,需要對超引數進行優化,給學習機選擇一組最優超引數,以提高學習的效能和效果。這一般是根據經驗進行設定,影響到權重w和偏置b大小的數值。

主要原因有以下2個:

多半是剛入門的演算法工程師做的事情,他們不是很懂神經網路的結構、資料分布等等,只能通過調整超引數,以期望獲得較好的結果,這樣有時候是可行的;

更重要的原因是,github上開源了很多模型,並附上了預訓練引數,如常用的檢測、分割、分類等等,這些模型都非常成熟,大部分直接呼叫就可以,然後根據自己的訓練資料,稍加修改,就可以得到非常好的結果。公司只要結果,不要求創新,開源專案已經可以做到這點了,所以大多數只要調參即可。

目前ai人才競爭越來越激烈,「調參俠」的時代已慢慢過去,這些事情其實根本不需要ai工程師來做,未來的研發工程師就可以承擔這些了! 幾年前如果熟練使用tensorflow,同時掌握基本的ai演算法就可以很容易找到乙份高薪的工作,但現在不一樣了,ai崗位的要求越來越高,對知識的深度也提出了更高的要求。

要想跟上時代,得武裝自己,才能不被淘汰。

對於真正的人工智慧工程師而言,他們往往是從資料和特徵下手的,同時還需要豐富的行業經驗。一定要記住一句行業內的諺語,資料和特徵才決定演算法 的上限,而選擇的演算法和引數只是決定了已逼近這個上限的速度。

人工智慧領域,還有一群從業者躲在牆角瑟瑟發抖,那就是大家說的調參師。乙個神經網路從理論到落地,有這麼幾個階段,乙個是模型構建,就是把別人**裡的網路搭建起來。然後是模型訓練,把自己需要的資料準備好,然後部署到顯示卡上去跑,這個過程有很多引數要調,很玄,屬於老中醫看病,全靠經驗,妙,不可言。一名調參師的日常是這樣的:

調參師接到需求,第一件事就是去github和各種框架的model zoo上當搬運工。調參師沒有設計網路的能力,如果github上沒有,就只能看**動手擼了,不僅費時費力,出了bug還得到處求人。

資料準備好了,調參師就開始調參了。嗯,先用預設值來一遍,不行,試試小一點的lr呢?不行,換個initializer試試?艾瑪,一不小心過擬合了,快快快,加大正則,加大正則還有救。

為什麼人工智慧落不了地?

人工智慧 行業擁有極為廣闊的想象空間和市場前景,而這也是幾年前人工智慧產業尚處於投資風口時,人工智慧創業企業向各路投資人反覆宣講的故事。但幾年過去了,在很多傳統行業,如醫療 教育 物流 交通以及城市管理等等,人工智慧的發展仍然處於小範圍試點階段,或者發揮著並不重要的作用,總體來說,有亮點,無驚喜。這...

為什麼人工智慧現在這麼火?

舊金山 今年,人工智慧進入主流業務,至少,已經成為了乙個市場度很高的賣點。saleforce此舉搶占了先機。oracle 世界上最大的軟體業務公司,在週日晚上於舊金山開始了全球客戶大會。大會最大的亮點是大資料的實時分析。oracle稱它為oracle a.i.另外,通用電氣發布了叫做predix的a...

《人工智慧工程師》回歸樹模型

當資料不是離散型變數而是數值或者連續值時,可以用回歸樹模型進行劃分。回歸樹模型的本質是對樣本空間的劃分。劃分的區域不相交的子區域。注意 區域rj中的樣本的結果是所有的樣本點取平均得到的結果。rss的偏差,這個是指預估結果和真實結果的差異。yi是真實值,yrj是指預估值 最小二分法 為什麼計算量大?空...