這11個觀點可能會讓你和深度學習擦肩而過

2021-08-19 12:49:03 字數 2640 閱讀 6159

我大部分走路的時間還有睡夢中的潛意識裡都會琢磨著deep learning 的問題。peter thiel 有乙個很有名的說法——「最後乙個公司的優勢」。意思是你可能不需要具備「第一啟動的優勢」,但是你一定要成為你行業裡最後乙個站著的公司。就像google有可能是最後乙個搜尋引擎公司,amazon有可能是最後乙個做電商的, facebook希望不是最後乙個社交網路公司等。但是讓我夜裡輾轉反側的是——深度學習有可能會是「人類最後乙個發明」(last invention of man)。

但是,咱們先別想那麼遠。不管怎樣,kurzweil在他《奇點臨近( singularity)》一書中預計在2023年實現的設想也是30年之後的事情。我們現在要做的就是在這30年里弄清楚想生活在像電影《極樂(elysium)》中那樣,還是什麼別的不知名的腐爛廢水裡。

從業人員接觸神經網路一般都是從線性回歸的介紹然後再到邏輯回歸。這是因為人工神經網路(ann)用的數學公式是一樣的。所以這裡瞬間產生偏見,導致人們認為經典的機器學習方式在深度學習的世界裡也可行。最後,對於dl最天真的解釋就是它是多層的ann。

當然,我們也有其他種類的機器學習方式,他們是用和dl不同的公式。但是,ml所有方法最基本的目標和一般概念都是曲線擬合。意思就是如果你能找到乙個合資料吻合的模型,它就是個好答案。但在dl系統裡,因為模型的引數太多,這些系統會預設過度擬合資料,這就足夠證明dl和ml是完全不同的系統了。

dl系統有乙個損失函式(loss function),它會測量**和輸入的資料吻合有多好。經典的優化問題也有損失函式,也稱為「目標函式」(objective functions)。這兩個系統會使用不同的啟發式方法(heuristics)去探索在很大的配置空間裡的最優點。以前人們認為dl 系統的 solution su***ce 已經很複雜,並且是不可能找到答案的。但神奇的是,乙個很簡單的優化方法——隨機梯度下降法(stochastic gradient descent )就可以得到很好的結果。

這就告訴我們其實這裡還有別的事情,和我們認識的優化完全不同的東西。

很多資料科學家都不太喜歡dl,因為它的**缺少很多可解釋性——這不僅是dl也是ml都有的特徵。資料科學家更喜歡使用概率方法,因為他們有更多模型的控制。這個導致他們的系統會用最少量的引數做**。這一切的推動力量都是源於對「簡單化或『奧卡姆剃刀原理(occam』s razor)』是對所有事物最好的解釋」的信念。

這是乙個自然的偏見,乙個只有5年歷史並且急速進化且易變的科技太不可信。我們當時也是這麼說微型處理器、網際網路、網路和移動技術的。對於大部分人來說,先等等看是安全的方法。對於沒有花很多時間分析細節的那些人來說,這的確是乙個合理的方式。但這也是乙個有風險的策略,不去關注有可能是暫時的安全,但是別的公司搶你的飯碗可能意味的你的滅絕。

有很多現在dl能幹的是在兩年前都覺得是完全不可能的。沒有人預見到電腦能在圍棋上戰勝人類;沒有人預見到現在會有無人車;沒有人預見到我們能有星際迷航那樣的翻譯能力。這些都那麼不可思議並且肯定有誇張的成分在。不好意思,我在這裡要戳破你迴避的「泡泡」,dl真的存在,並且你每次用手機都在使用它。

我們經歷過太多次因ai的前景所帶來的失望結果。這個說法走得很遠,因為這在以前經常發生,所以它早晚會再次發生。這個問題是,儘管那些失望存在,但ai的研究帶來了很多軟體功能的飛躍,而且這些功能我們現在都自然而然地使用著,並且從來都沒有察覺到他們的存在。「優秀的老式人工智慧」(good old-fashioned ai)已經嵌入在很多今日的系統裡。

現在對dl 的開發正在加速進行,而且我們也有很多大問題需要解決。需要大量資料和缺少無監督的訓練是其中的兩個問題。但這不代表我們今天的成果沒有價值。dl已經可以開車了,如果現在再來乙個冬季,就這一點就足夠證明現有階段已經十分有用了。

目前,研究團隊還沒有紮實的理論來解釋為什麼dl這麼有效。我們想過為什麼多層神經網路比少幾層的更有效,但是我們還不能理解收斂性如何發生,或者好的泛化如何實現。dl現在就是乙個實驗品,我們還在學習這類系統的特徵。同時,雖然沒有紮實的理論理解,這些工程師一樣在前進。

研究員們正在利用他們的直覺和受過教育的猜測建立更好的模型。換句話說,他們不會為了等待更好的理論而暫停他們的發展。這和生物科技領域的研究一樣,他們測試很多種組合然後遇到他們不能解釋的新發現。科學和科技的發展的確有些不確定的混亂,但是你不應該因為這而放棄它的優點。

dl和我們大腦裡的神經元差異很大。dl 的學習方式(比如sgd)是不能用我們大腦裡的什麼結構去模擬的。但這裡的論據是,如果它不和大腦類似,它就不能執行大腦能做到的推理和學習。這當然不是很有力的論據。可飛機雖然長得不想鳥,但是它一樣會飛呀。

自己沒有專業知識不是逃避不去外面找專業知識的藉口。並且,這也不應該成為阻止你的專家團隊去學習這個新技術的理由。但是,如果你的專家是教條死板的那種,這就說明你應該去尋求第二個沒有偏見的意見。

乙個企業有很多業務流程。如果你沒有去檢查哪些流程是可以被現有的dl自動化的,那你就沒有權力去說dl對你不適用。其次,你可能會發現現在沒有的、但是可以用dl實現的流程或商業機會。你真的不能回答這個問題,直到你在這方面做了盡職的調查工作。

google、facebook等很多大公司挖走了很多dl的 天才。 這些企業沒有興趣和小公司合作,去發現它們具體的需求和機會。但所幸這些大公司還允許它的研究員公開他們的研究成果。所以我們可以看到它們最新的發展成果,並且可以提取它們學到的知識,應用在你的場景裡。還有些公司比如intuition machine,加入它們會讓你取得在dl 技術上的競爭優勢。

你可能會讀錯的字大集合

你可能會讀錯的字大集合 雪帆奧數王老師 你可能會讀錯的字大集合 覬覦 j y 齟齬 j y 囹圄 l ngy 魍魎 w ngli ng 紈絝 w nk 鱖魚 gu y 耄耋 m odi 饕餮 t oti 痤瘡 cu chu ng 踟躇 ch ch 倥傯 k n z n 另 倥侗念k ngd ng。彳...

這個Windows檔案可能會隱秘地收集你的個人隱私

外媒zdnet在週三 9月19日 發表的一篇報道中指出,如果你是觸控筆或觸屏計算機的使用者之一,那麼在你的計算機上很可能存在這樣乙個檔案,它在過去的幾個月甚至幾年時間裡已經隱秘地收集了大量有關於你的敏感資料。這個檔名為 waitlist.dat 根據數字取證和事件響應 dfir 專家barnaby ...

Vue 實際專案中你可能會遇見問題

紙上得來終覺淺,絕知此事要躬行!vue的文件和教程看的太多,小的demo做的多,也不如自己實際的進行乙個完整專案的開發。只有做了才知道原來問題這麼多,這裡列舉了一些你做demo教程可能不會遇見的坑。一 專案的登入攔截及使用者許可權訪問控制問題。乙個很常見的需求就是對未登入的使用者進行路由攔截和使用者...