第18月第22天 機器學習first

2022-06-23 14:45:12 字數 2268 閱讀 9441

1.網易公開課 機器學習

2.傳統的機器學習:

機器學習(ml)技術在**中發揮了重要的作用,ml經歷了多代的發展,形成了具有豐富的模型結構,例如:

1.線性迴歸。

2.邏輯迴歸。

3.決策樹。

4.支援向量機。

5.貝葉斯模型。

6.正則化模型。

7.模型整合(ensemble)。

8.神經網路。

在大資料時代,雲端計算和大規模並行處理基礎架構的共同發展,使得機器處理能力在二十一世紀初得到了極大的提升。我們不再侷限於低功耗/簡單的模型。例如,當今最流行的兩種主流機器學習模型是隨機森林和梯度提升樹。儘管如此,兩者都非常強大,並且提供了非線性模型擬合的訓練資料,但資料科學家仍然需要仔細地建立特徵以獲得良好的效能。

與此同時,電腦科學家重新使用神經網路的許多層來完成這些人類模仿的任務。這給dnn(深度神經網路)帶來了新的生機,並在影象分類和語音識別任務方面提供了重大突破。dnn的主要區別在於,你可以將原始訊號(例如rgb畫素值)直接輸入dnn,而不需要建立任何域特定的輸入功能。通過多層神經元(這就是為什麼它被稱為“深度”神經網路),dnn可以“自動”通過每一層產生適當的特徵,最後提供一個非常好的**。這極大地消除了尋找“特徵工程”的麻煩,這是資料科學家們最喜歡看到的。

dnn也演變成許多不同的網路拓撲結構,所以有cnn(卷積神經網路),rnn(遞迴神經網路),lstm(長期短期記憶),gan(生成敵對網路),轉移學習,注意模型(attention model)所有的這些被統稱為深度學習(deep learning),它正在引起整個機器學習界的關注。

3.4.第一週

統計分析

分析資料集中的特點,例如平均值,中位數,標準差以及分位數等。

第二週資料建模

瞭解資料的基本型別;學習如何用 sklearn 處理資料集。

第三週評估和驗證

學習如何用準確率或者召回率等指標來測試以及衡量提高表現。

第四周瞭解錯誤和複雜度

瞭解錯誤型別、過擬合、欠擬合;學習如何用學習曲線,模型複雜度來識別問題;應用交叉驗證等技術提示你模型的表現。

第五週監督學習

迴歸和分類的區別;用線性迴歸****;用對數機率迴歸來**狀態。

第六週決策樹

訓練決策樹來**狀態;用資訊熵來構建遞迴決策樹。

第七週神經網路

神經網路的定義;用反向傳導訓練一個神經網路;從一個單個神經元構建一個神經網路。

第八週支援向量機

學習如何訓練支援向量機來對資料進行線性分割;用核方法來訓練支援向量機使它能夠分割線性不可分的資料。

第九周非引數模型

基於例項的模型。

第十週貝葉斯方法

學習貝葉斯法則,瞭解如何用樸素貝葉斯演算法來**資料;用貝葉斯方法來訓練模型;用貝葉斯推斷來建立多變數貝葉斯網路;貝葉斯自然語言處理迷你專案。

第十一週

整合學習

通過 boosting 來增強傳統演算法;隨機森林;adaboost。

第十二週

聚類學習資料聚類的基本方法;使用 k-平均演算法來聚類資料;single linkage 聚類法;高斯模型和最大期望演算法。

第十三週

特徵工程

歸一化你的資料;學習如何為訓練選擇最佳特徵。

第十四周

降低維度

用主成分分析和獨立成分分析來降低特徵維度。

第十五週

強化學習

學習基本的馬爾可夫決策過程;用 q-學習尋找最優策略。

第十六週

博弈論撲克策略;納什均衡;極小化極大策略。

第十七週

機器學習到深度學習

深度學習基礎,包括 softmax、獨熱編碼和交叉墒;簡單的線性分類模型,例如對數機率迴歸以及與之相關的損失函式。

第十八週

深度神經網路

回顧:什麼是神經網路?啟用函式:sigmoid、tanh 和 relu;如何用反向傳播和鏈式法則來訓練神經網路;如何用正則化和dropout等方法提示神經網路表現。

第十九周

卷積神經網路 什麼是卷積神經網路;卷積神經網路如何用於識別。

第二十週

針對文字和有序資料的深度模型

如何用深度神經網路實現 word2vec 對文字進行建模;迴圈神經網路基礎;長短期記憶人工神經網路 lstm。 

5.記得有一篇文章總結的就非常易懂,他認為機器學習其實可以分成三類,分類、迴歸、聚類。

結合到演算法裡面:

如果看過一遍《機器學習實戰》,應該就會對上述的演算法有一定的瞭解。不需要到公式推導級別,先能瞭解他們的用法即可,比如:

這麼多演算法其實只是機器學習中的一部分....

第26月第20天 springboot

1 pom xml中新增支援web的模組 org springframework boot spring boot starter web pom xml檔案中預設有兩個模組 spring boot starter 核心模組,包括自動配置支援 日誌和yaml spring boot starter ...

第44月第19天 SDK license

1 需要提供的引數 ios 應用bundleid android 包名和簽名資訊 md5 格式小寫無冒號 2 預燒錄預登記動態註冊預燒錄,指的是,我們後臺預先生成授權的license檔案,然後預先寫入硬體裝置的儲存檔案中。在裝置首次啟動的時候,就直接調取license檔案進行啟用。這種方式適用於需要...

第27月第28天 iOS bundle

1 7 如果將自己打包的bundle給別人使用,別人在打包上傳過程中可能會遇到錯誤提示如 或者或者 網上也有很多的解決辦法,這裡提供一種解決方法,就是刪除bundle裡的執行檔案 找到工程中的test bundle,右鍵單擊後 選擇 顯示包內容 ,找到裡面黑色的可執行檔案test,刪除掉,然後找到裡...