《機器學習》讀書筆記一序言部分

2022-01-10 21:30:01 字數 1646 閱讀 1652

參考文件: 《陸汝鈴:六問機器學習》

文章摘自《機器學習》序言部分

在人工智慧發展早期,機器學習技術內涵幾乎全部是符號學習,從二十世紀九十年代起,統計機器學習猶如一匹黑馬橫空出世,迅速壓倒並取代了符號學習的地位。但這並不意味著符號學習完全被統計學習所取代,相反單純的統計機器學習,在最近的發展歷程中已經走到的盡頭。「三十年河東,三十年河西」,符號學習又有了翻身的機會。但是這並不意味著統計學習的衰退。相反,這是機器學習的乙個重要的轉折點。從此以後統計學習應該和知識的利用相結合。呈「螺旋式上公升,進入更高階的形式。」,否則,統計學習可能面臨著停滯不前的危險。最近幾年,人工智慧很大程度上集中於統計學和大資料,隨著計算能力的大幅度提高,這些領域曾經取得過令人影響深刻的研究成果。但是隨著技術的不斷發展和改進,提高。相信總有一天ai領域會對其say goodbye。轉向更加基本的認知科學研究。返璞歸真,回歸最基礎的「認知」。

王珏教授認為統計機器學習不會一帆風順,其依據是,統計機器學習演算法都是基於樣本資料獨立同分布的假設,但自然界千變萬化,**來的那麼多獨立同分布。那麼問題就來了,獨立同分布條件對於機器學習來說真是必須的嗎?獨立同分布不存在一定是乙個不可逾越的障礙嗎?無獨立同分布條件下的機器學習也許只是乙個難題並非是乙個無法解決的問題,該書的序言的作者,陸汝鈴教授提到乙個想法,前段時間所提及的遷移學習也許將會給解決這一問題帶來一線曙光。儘管現階段的遷移學習需要遷移雙方同時具備「獨立同分布」條件,但是不同分布之間的遷移學習,同分布和異分布之間的遷移學習遲早會出現。

近年來,大熱的「深度學習「,」無終止學習「等等,廣泛贏得了社會上的關注。尤其是」深度學習「,吸引了無數研究者前去學習,可是它真的就代表這機器學習的新方向嗎?但很多學者認為,深度學習的大熱,在理論和技術上並無大的創新,只不過是由於硬體技術的提高,從而提高了計算速度。使得人們能夠採用原來複雜度很高的演算法,從而得出更加精確的結果。這對推動機器學習的發展具有重大的意義。

數學,在機器學習上起著關鍵的作用,」數學之大,就像大海「,機器學習上不僅僅是統計學的應用。其他數學分支也在機器學習上得到了很好的應用。高深的數學理論是推動機器學習發展的最好動力。數學的不斷發展進步,將對機器學習的發展產生深遠的影響。同時數學家介入機器學習研究之中是十分必要的。

同時,大資料時代的出現,對於機器學習帶來的影響是不可磨滅的,它給現階段的統計機器學習帶來了更多機遇。海量的資料更加需要統計,抽樣,分類。這些更需要統計學來支撐。大資料時代正在加速中機器學習的發展。

最後,我有一點我自己的思考。也算是我自己的一些想法吧。

我們為什麼要學習機器學習?真的是隨波逐流嗎?至少我不是。在大二上學期開學一次課程設計老師給我演示過他做的乙個專案之後,我就對這方面產生了濃厚的興趣,而這個也和傳統的語言學習有所不同,它注重積累,不是那些培訓班三五個月能夠速成的。當然,這半年來我也接觸了很多培訓班的人,也接觸了很多和我有同樣愛好的人。有一點可以明顯發現,很多機器學習的原理十分深奧,對於培訓班來說,線上教學,不可能把大多數時間拿來解釋原理,更多是時間,而這對於想要深入了解的人並無好處。舉個較為形象的比喻,」學習會使用機器學習你只是會吃菜,深刻理解原理你將學會自己炒菜「。

現在我來用我的觀點回答一下,我為什麼要學習機器學習。大話就是,如今的視界飛速發展,技術日新月異。而最近今年機器學習大熱,大有取代傳統開發之勢,同時隨著物聯網技術的發展,更多的技術上被用於生活,簡單的說就是需求決定了事物的發展趨勢。

從小處著眼,那邊是興趣,興趣是最好的老師,一旦你對這方面建立了一定的興趣之後,將會取得很快的進展。

機器學習讀書筆記

第一章 引言介紹一些常識引入什麼是機器學習,機器學習的一些術語資料,規律,泛化,假設空間歸納偏好。1,假設空間 假設空間 監督學習的目的在於學習乙個由輸入到輸出的對映,這一對映由模型來表示。換句話說,學習的目的就在於找到最好的這樣的模型。模型屬於由輸入空間到輸出空間的對映集合,這個集合就是假設空間 ...

周志華 機器學習 讀書筆記

分類 classification 的是離散值,比如 好瓜 壞瓜 回歸 regression 的是連續值,例如西瓜成熟度 0.79 0.95 泛化 generalization 學得模型適用於新樣本的能力,稱為 泛化 generalization 能力.資料探勘 data mining 從海量資料中...

《機器學習實戰》讀書筆記

監督學習使用兩種型別的目標變數 之所以稱監督學習,是因為這類演算法必須知道 什麼,即目標變數的分類資訊 在無監督學習中,將資料集合分成由類似的物件組成的多個類的過程被稱為聚類 將尋找描述資料統計值的過程稱之為密度估計 是 否要 預測目標 變數的值 是 監督學習 目標變數型別 begin離散型 分類演...