）對統計方法的思考

2010-05-19 19:58:08

| 分類：

研究筆記|字型大小

原文名為：

homework? review ***** for science

今天作業的一部分，是以science的reviewer的身份去review一篇文章，並攥寫review報告。

這篇文章是已經在2023年發表於science上，標題非常有趣：

statistical learning by 8-month-old infants

大家可以非常容易在google上找到這篇文章的全文。

文章指出乙個乙個很值得思考的心理學實驗結果：乙個很小的嬰兒，只需要聽上兩分鐘的連續語音，就能形成對以後聽到的連續語音進行有效分詞的能力。

這篇文章闡述的是在語言學習方面的結果，而事實上，在所有智慧型領域，我們都可以看到類似的觀察。比如在vision，人們都沒有經過系統的可控的物體識別訓練，但是卻非常容易獲得在複雜的世界上對物件進行迅速的分割，識別，以及獲取其它方面資訊的能力，而目前computervision的能力在最簡單的可控實驗中依舊舉步維艱。

人類只需要很少的訓練的情況下能夠迅速獲得非常靈活有效的「模型」去應對充滿變化和干擾的實際輸入，而計算機學習演算法通過在大量樣本訓練，也很難接近哪怕是嬰兒的水平呢？人類的學習機制和目前人工智慧研究所採用的方式究竟有什麼不同？

現在統計學習領域百花齊放，但是，大部分的方法，無論formulation有多大的數學上的差別，基本上都是讓乙個具有某種結構的model按照某種準則去"fit"訓練資料，通常還加上某種複雜性的約束。不過，很難想像人類是使用類似的方法從現實中學習的。我們每天感受到的是乙個不斷變化，各種要素充分融合的世界，沒有分離的「訓練資料」去學。我們的大腦能夠理解非常複雜的東西，但是我們所接觸的「訓練集」按照經典統計學系理論的觀點是無法支援這種複雜性的。雖然，我們經常會犯被觀察所誤導的錯誤，但是，相比於機器學習演算法，我們overfitting的機會和程度遠小得多。

我相信，我們的學習過程遠比目前所有的機器學習演算法聰明得多，絕不僅僅是observed->fitting這樣的統計形式。ai的主要領域的研究現在過分依賴於統計建模，可是統計有它固有的瓶頸。早在vapnik他們建立統計學習基礎的時代，已經明確告訴了大家，統計學習受到複雜性的根本制約。因此，統計學習本身並沒有足夠能力到達人工智慧的目標。相對於人類真正的智慧型來說，統計所能產生的智慧型只能認為是一種非常初級的形式。

從rule-based的專家系統到神經網路，再到統計學習，ai幾十年內經歷了幾次大規模方**更新的浪潮，但是是不是離真正的智慧型越來越近了呢？我們究竟是不是走在乙個正確的方向上？

）對統計方法的思考

對無效思考的思考

linux shell對行數進行統計的方法

陣列中逆序對統計方法

）對統計方法的思考

對無效思考的思考

linux shell對行數進行統計的方法

陣列中逆序對統計方法

相關推薦