離終極智慧型的下乙個一步之遙

思索機器學習的新方向，漫漫，還是有些無力。

被乙個問題困擾良久，仍不得解。這個問題是什麼呢——影象裡物件的計數問題。

眾所周知，現在的影象中物件計數有比較成熟的一套演算法，你看yolo, ssd, resnet, maskrcnn滿天飛，都是在往bounding box上鑽。然後問題就變成了找到bounding box再計算正確box的數量。這其中的演算法實際上包含了兩個步驟：

那麼這個演算法有沒有問題呢，當然有。我們慢慢展開。

首先第乙個問題是，我們知道現有的基於bounding box的模型能識別多個物件是因為有anchor method的原因。anchor method其實限制了模型的精度，它只能識別出有限的物件，如果中的物件數量超過了anchor method當時訓練的規模，它就抓瞎了。這樣演算法也就會出現錯誤的風險。

第二個問題是，現在的機器學習，分類已經如火純青，但是在計數上沒有什麼進展。設想，如果有乙個小孩子，被教完計數，他可以數出中的指定型別的物件有多少個；也就是說，給定乙個輸入，輸出直接是乙個數字，中間的過程是小孩子自己在學習中生成的。並不是像我們現在的演算法，先用機器學習再手動寫乙個計數程式。那麼，計算機如何學習計數？

我們來看一下現在的機器學習大概做了什麼：一些設定好的layers，資料一次通過，最後得到乙個分類或者乙個回歸結果；這裡，回歸結果其實可以對映成一種分類，所以我們不妨設模型最後得到了乙個分類。那麼由這種模型進行組合，其實是形成了乙個大的狀態機，或者走出了類似於馬科夫鏈的圖結構；換句話說，我們在使用matrix的時候，它計算最終成為乙個分類，我們不妨把這個分類簡化為2值分類，那麼其實乙個模型如果是二分類，就是完成了一次大if判斷，把他們組合起來也就是很多if；什麼意思呢？就是說，現在的機器學習模型幫助人類能快速生成規模龐大的if群，以前程式設計師只能寫個十幾個if，現在能寫幾千萬個，那它的精度確實高了很多，也能執行很複雜的任務了，可是和智慧型相去甚遠。而光靠if很難完成學習計數，這就是現在機器學習的瓶頸。

遇到瓶頸，怎麼突破呢？下乙個一步之遙是什麼呢？

我們再來看看計數的過程，人在中計數一般是專注於某個區域，開始識別並計數，並重複專注某區域識別計數累加；在完成乙個區域的同時，會使用記憶去標記這個區域已完成，這中間其實是又乙個規劃過程，而這個規劃過程中其實使用了一種重複，或者說迴圈。是了，我們現在還沒有找到穩定表述迴圈的方法。熟悉彙編或者c的開發者應該比較清楚，for或者while其實最終都是編譯成goto的，那麼這個goto具體是如何能在機器學習中實現呢？最簡單的迴圈其實是可以實現的，比如在機器學習的模型中加入乙個gate層，它的結果為0就讓資料流繼續往下走，為1就讓資料流跳轉到另乙個層上。但是這個跳轉，看似簡單，它如何去學習，還需要更多研究。當然隨機跳轉，競標賽最後取最好的遺傳演算法可以勝任這個任務，但是學習模型如何收斂又是另乙個巨坑…其實機器學習的最終，就是可以自主生成乙個滿足需求的可執行程式…

生而為人，也是否是乙個滿足需求的程式？

壓縮

離終極智慧型的下乙個一步之遙

售前，你離「精品方案」只差一步之遙

暴風離退市僅一步之遙，6萬投資者何去何從？

離成功一步之遙開發者需知的5條應用內測法則

離終極智慧型的下乙個一步之遙

售前，你離「精品方案」只差一步之遙

暴風離退市僅一步之遙，6萬投資者何去何從？

離成功一步之遙 開發者需知的5條應用內測法則

相關推薦

離成功一步之遙開發者需知的5條應用內測法則