第三部分 機器學習 ML 策略1 6 筆記

2021-08-19 18:26:38 字數 909 閱讀 1993

1.11 超過人的表現

surpassing human-level performance

例子 分類任務

case1:可以認為貝葉斯誤差為0.5%,可避免偏差是0.1%,方差是0.3%,應該側重於調整方差。

case2:訓練誤差以及開發誤差以及超過了人類水平,很難評價是該調整方差還是偏差,模型的精度肯定還是可以進一步改進的,但是並不清楚最優貝葉斯誤差是多少,在演算法調整的方向上會變得不清晰,這也就意味著在超過人類水平,演算法改進難度增加。

機器學習超過人類水平的領域:

注:上述四個領域,採用的資料多是結構化資料(structural data),而且並非自然感知問題,即非計算機視覺、語音識別、nlp問題。人類在自然感知問題上會很在行。並且在處理上述問題時,可以獲取並訪問到大量的資料,可能比任何人能夠獲取的資料還要多。

1.12 改善你的模型表現

improving your model performance

乙個監督學習演算法達到實用,需要滿足兩個前提:

針對訓練集,模型擬合的足夠好 —— 低可避免偏差

模型在開發集和測試集上泛化能力較強 —— 方差不能太大

提公升機器學習系統的策略:

低偏差 訓練更大的模型

增加訓練時間

使用更好的優化演算法

新的網路架構 (rnn、cnn etc.)

超參搜尋

低方差 更多的資料

正則化 —— l2 、dropout 、 data augmentation ...

新的網路架構

超參搜尋

第三部分 機器學習 ML 策略2 4 筆記

2.9 什麼是端到端的深度學習 what is end to end deep learning 一些資料處理系統以及學習系統往往需要多個階段的處理,而端到端的學習是忽略這些中間處理過程,用單個的神經網路來代替。例子1 語音識別 傳統方式 原始音訊 mfcc特徵提取 音位 文字 端到端 原始音訊 文...

劇本第三部分

第三部分劇本 場景一 女生宿舍,a趴在桌子上睡覺,電腦螢幕亮著,是vs 但是就寫了一行 小碼趴在a的胳膊上睡著。突然,a醒了,發現自己上課要遲到了,a 哎呀,完了完了,大中午的怎麼趴在這睡著了 邊說話邊收拾書包 轉頭看向小碼 a 把你放哪呢 說話的時候四周環視 算了,跟我去吧,我先把你放書包裡 說話...

第三部分 效能

索引管理 效能優化 效能監控 db.c1.find explain 查詢的詳細資訊列出來 db.c1.getindexkyes 所有索引的字段 db.c1.getindexes 所有索引的相關資訊 2 唯一索引 只需要在ensureindex命令中提定 uniqure true 即可建立唯一索引,如...