離終極智慧型的下乙個一步之遙

2021-10-10 14:18:27 字數 1547 閱讀 9371

思索機器學習的新方向,漫漫,還是有些無力。

被乙個問題困擾良久,仍不得解。這個問題是什麼呢——影象裡物件的計數問題。

眾所周知,現在的影象中物件計數有比較成熟的一套演算法,你看yolo, ssd, resnet, maskrcnn滿天飛,都是在往bounding box上鑽。然後問題就變成了找到bounding box再計算正確box的數量。這其中的演算法實際上包含了兩個步驟:

那麼這個演算法有沒有問題呢,當然有。我們慢慢展開。

首先第乙個問題是,我們知道現有的基於bounding box的模型能識別多個物件是因為有anchor method的原因。anchor method其實限制了模型的精度,它只能識別出有限的物件,如果中的物件數量超過了anchor method當時訓練的規模,它就抓瞎了。這樣演算法也就會出現錯誤的風險。

第二個問題是,現在的機器學習,分類已經如火純青,但是在計數上沒有什麼進展。設想,如果有乙個小孩子,被教完計數,他可以數出中的指定型別的物件有多少個;也就是說,給定乙個輸入,輸出直接是乙個數字,中間的過程是小孩子自己在學習中生成的。並不是像我們現在的演算法,先用機器學習再手動寫乙個計數程式。那麼,計算機如何學習計數?

我們來看一下現在的機器學習大概做了什麼:一些設定好的layers,資料一次通過,最後得到乙個分類或者乙個回歸結果;這裡,回歸結果其實可以對映成一種分類,所以我們不妨設模型最後得到了乙個分類。那麼由這種模型進行組合,其實是形成了乙個大的狀態機,或者走出了類似於馬科夫鏈的圖結構;換句話說,我們在使用matrix的時候,它計算最終成為乙個分類,我們不妨把這個分類簡化為2值分類,那麼其實乙個模型如果是二分類,就是完成了一次大if判斷,把他們組合起來也就是很多if;什麼意思呢?就是說,現在的機器學習模型幫助人類能快速生成規模龐大的if群,以前程式設計師只能寫個十幾個if,現在能寫幾千萬個,那它的精度確實高了很多,也能執行很複雜的任務了,可是和智慧型相去甚遠。而光靠if很難完成學習計數,這就是現在機器學習的瓶頸。

遇到瓶頸,怎麼突破呢?下乙個一步之遙是什麼呢?

我們再來看看計數的過程,人在中計數一般是專注於某個區域,開始識別並計數,並重複專注某區域識別計數累加;在完成乙個區域的同時,會使用記憶去標記這個區域已完成,這中間其實是又乙個規劃過程,而這個規劃過程中其實使用了一種重複,或者說迴圈。是了,我們現在還沒有找到穩定表述迴圈的方法。熟悉彙編或者c的開發者應該比較清楚,for或者while其實最終都是編譯成goto的,那麼這個goto具體是如何能在機器學習中實現呢?最簡單的迴圈其實是可以實現的,比如在機器學習的模型中加入乙個gate層,它的結果為0就讓資料流繼續往下走,為1就讓資料流跳轉到另乙個層上。但是這個跳轉,看似簡單,它如何去學習,還需要更多研究。當然隨機跳轉,競標賽最後取最好的遺傳演算法可以勝任這個任務,但是學習模型如何收斂又是另乙個巨坑…其實機器學習的最終,就是可以自主生成乙個滿足需求的可執行程式…

生而為人,也是否是乙個滿足需求的程式?

壓縮

售前,你離「精品方案」只差一步之遙

寫一篇解決方案並不難,難在於寫一篇 客戶高層喜歡 客戶基層喜歡 自己單位技術人員也喜歡 的方案就不簡單了,因為這三類是 務虛 務實 填坑 的不同型別人。下面談談你離精品方案差的那些 你知道客戶高層想什麼嗎?你知道客戶基層想什麼嗎?你知道公司技術員想什麼嗎?高層一般處於公司決策層,他們需要掌控公司全域...

暴風離退市僅一步之遙,6萬投資者何去何從?

暴風或將迎來既定程式設計客棧的終局。近日,暴風集團公告稱,公司尚未聘請到首席財務官和審計機構,預計無法在 6 月 30 日前披露 2019 年年度報告以及 2020 年第一季度業績預告與季報,而根據創業板的相關規定,公司 將於 7 月 1 日起停牌,屆時公司 將停止交易。這意味著,擁有6.35 萬名...

離成功一步之遙 開發者需知的5條應用內測法則

應用內測很重要 內測寶典 1.找到有價值的目標使用者 還記得去年憤怒的小鳥團隊曾在csdn移動開發者大會上提到 開發憤怒的小鳥時候,先是給一些親朋好友進行體驗,獲得了極大好評,隨後開發者將這款遊戲分享給他們的親朋好友。於是在芬蘭,憤怒的小鳥開始火了起來。popcap亞太總裁james gwertzm...