大學生如何入門學習機器學習

2021-08-29 18:44:23 字數 2845 閱讀 9696

謝邀寫這篇blog哈哈,一直沒有寫blog的想法,平時都是自己邊學習邊把知識點總結到紙上。關於學習方法的問題,我個人覺得很重要,機器學習這一塊點很多,有數學,有計算機,有應用,有方**,如何在本科生階段玩轉機器學習呢,我覺得很重要一點就是學習方法了,這個靠大家平時學習時候去總結,當然在我blog裡面我會不時穿插一些我自己的學習方法,以下僅僅是本人在大學兩年學習中相對來說比較短的時間接觸機器學習的一些心得體會及學習經驗的分享,希望能給大家帶來一些啟發,不足之處望大家指正。

進入正題,一名本科生如何入門學習機器學習?

此處我們暫且不**科生,理科生工科生課程大多在大一會有高等數學和線性代數兩門課,機器學習大約需要多少數學知識呢?個人覺得如果你是想從事機器學習演算法基層工作,偏做數學學術的同學,你可以本科兩年左右把高代、數分這些主幹課過一遍,至於大三的一些實分析、復分析、泛函實變這些,個人覺得機器學習極少用到這些,當然也可能是我程度還不夠深入,我的建議是大家不要浮躁地一開始就拿著**開始擼專案,但是也不要讀成書呆子,大家一定要明白乙個觀點,如果你不想成為陳景潤那樣的數學家,大可不必花上大把時間在各種各樣的數學專業書上。那麼回到我們的問題機器學習到底需要多少數學知識呢?從我個人學習經驗,鄙人在學校大約學過高等數學、線性代數、離散數學、概率論與數理統計這四門主幹課,平均分大約在88分左右,至於為什麼平均分沒上95,是因為實在是懶得複習每本書那一章背的讓人頭疼的公式,機器學習需要的數學大約是高數微分積分思想那塊(泰勒展開可以好好複習複習)、線性代數基礎書加上部分求導(矩陣的跡這些)、概率論與數理統計(貝葉斯看看,然後是分布那塊),這幾塊內容實在在這幾本書算是基本內容了,很簡單。之前見過一些,有的可能會說這些操作在現在流行的平台都有許多包能用巴拉巴拉的,但是不要忘了我們雖然不是「造房子」的人,但是最基本的一些東西還是希望同學們在學習的過程中去證明證明。在已有比較好的數學基礎上去看機器學習的演算法會輕鬆很多,也解決了部分同學一心趴倒在數學坑里的問題(執著於數學的科研小夥伴請忽略我這一大段話,統計學大佬惹不起)。

好啦,以上就是機器學習在數學方面的要求。接下來我們可以愉快地學習機器學習啦。

不得不說ml博大精深,看了很久很久,我發現自己還是停留在學習階段,也就是怎麼說,在有的人看來屌屌的,但是實際上讓我立馬接乙個專案,感覺壓力山大啊。這時候我開啟的b乎,手動滑稽臉,發現李航老師的《統計學習方法》,這個評價不是一般的好,繼續買書刷書,刷完感覺數學功底理解上公升了乙個層次。以上書籍都很安利的。後來alexa大佬在刷華盛頓大學的ml課程,據說也很nice,但是課程量太大加上後來國家某局**vpn,沒得看,算是小遺憾了。

搞了一波事情,發覺無聊了,這時候來了本深度學習,還是yoshia bengio大佬,別說了,再貴都買,目前刷了五章, 一直炒現飯,我給自己本科要求是不玩深度學習,但是進來了還是看看吧,就是玩玩,沒指望自己能玩轉卷積這些,只是看看。近期什麼狀態呢,(⊙o⊙)…

感謝大學兩年以來幫助過我的學長學姐們,感謝我最親愛的honey,沒錯就是你呀!

忘了怎麼打分割線了,姑且這樣湊合吧。出去交換了一波準大四來補全一下。(不知道算不算畫蛇添足2333)

如果你是大一/大二同學,請好好學習數學的同時刷完李航的《統計學習方法》,(最近大家都在看,似乎是國內院校神書)這本書蠻薄的,前前後後因為實習各種事詳細看了好幾遍,至今也不敢說自己完全都會,甚至前兩天和乙個研究生學長討論一下把我問住了,只能說這本書中許多問題需要深入思考:為什麼要用這個方法、這個方法為什麼好、這個方法還能用在**。其實在平時學習與看書這件事不衝突。

還有幾本實踐書,《python實踐》大約是這麼寫,harrington寫的,主要是基礎演算法的例項。然後是《tensorflow深度學習框架》這本是科大學長安利,出到了第二版,也挺不錯。實踐書,演算法書都挺不錯,同型別多看看也差不多了,主要提高coding和對這些問題的思考,比如這些演算法背後的一些哲學思想(開玩笑2333)。

至於周老師的西瓜書,可以當作reference之類的看,裡面工程內容也很多,如果有能力(看完李航老師書的前提下)跳過演算法部分,專注工程的一些trick。還有一點是不管用什麼方法,coding是要有的,我的blog基本上囊括了machine learning的一些基本演算法。當然了,等你看完這幾本,其實你還沒入門。。。

同時比賽也可以玩玩呀,acm,阿里的,kaggle上的都不錯,可以拿得出手,鍛鍊鍛鍊。(當然還有jdata,tx社交網路,攜程滴滴這些)還有數學建模之類,以及各種網際網路+之類的比賽水水。ps數學建模玩的好真能保送北大,因為國賽是會排名的,隔壁寢就保了。(當然acmworld final也能保,同實驗室的學長15final打了世界30多吧,毅然決然放棄博,感覺他考個toefl就能上mit,後來去了pony投奔樓教主,稅後嘿嘿嘿)學校211弱渣,碰巧大牛還是有的。

還有些別類例如r, scala, swift 這些語言也是相關。whatever, 語言只是工具據,當然也有各自擅長吧,如果非要選乙個當然是r了,對初學者或者是外系同學比較友好(學好英文自然懂r語言qaq),據我所知數學和經濟大類一般都是用r語言做分析(在台灣交換的舍友一天到晚用r做高維資料的證明,coding估計比我還多)。除了計算機外,時間序列也很不錯,之前做過很久的經濟方面的東西,但是苦於沒有學計量經濟學,所以後面arma, arima, garch這些都學的很艱難,當然也發現lstm也不是總是好用,用time series的方法也不見得就比新的方法差多少,差的是修仙調參罷了。

總之就是這麼多,本科發*****還是比較難。(我指的是cvpr,emmm以及稍微比cvpr低一些的ieee子會的一些)因為隨便水水真的不好哇,雖然感覺cvpr也挺多灌水嫌疑文章,雖然我們寫不出來,但是你仔細看多了,水不水難道看不出嘛,評價水不水大約就是別人用起來爽不爽(引用量)、對社會效益大不大(會不會有公司看中你請你帶實驗室去賺錢)。當然了做ai感覺最好還是碩士往上走,但是讀碩士肯定得拿出來**,雖然很多學校要求不高,但是你得想清楚競爭力在哪兒。*****可能你在學校更有環境發(如果能去滴滴實驗室or)

plus:推薦兩本在看的《python深度學習》《gan實戰生成對抗網路》

原文:

大學生如何應聘高薪IT職位

jacky 秘密也談不上,我覺得良好的職業定位和持續的努力是我過去的學員成功的關鍵。一方面用人單位招不到合適人才,一方面應屆畢業生卻難以找到理想工作 其實關於這個問題我們也一直在探索和研究。經過廣泛查證後我們得出了以下兩點結論 第一 高校計算機專業課程設定存在一定的滯後,開設的課程也多偏重理論基礎的...

大學生如何應聘高薪IT職位

jacky 秘密也談不上,我覺得良好的職業定位和持續的努力是我過去的學員成功的關鍵。一方面用人單位招不到合適人才,一方面應屆畢業生卻難以找到理想工作 其實關於這個問題我們也一直在探索和研究。經過廣泛查證後我們得出了以下兩點結論 第一 高校計算機專業課程設定存在一定的滯後,開設的課程也多偏重理論基礎的...

貧家大學生如何權衡「考研」「就業」

貧家大學生如何權衡 考研 就業 281451020 qq.com 先說說我對 貧家大學生 的定義。父母不是官 也不是大老闆的普通的勞動人民家庭的小孩。從小出生 寒門 通過自己的努力,苦讀10多年,總算考試了大學。父母 家人很大的指望就是 希望讀了大學 就可以改變自己的命運 從而帶動家庭的改變 乃至改...