機器學習策略

2021-08-22 12:05:24 字數 813 閱讀 3784

翻譯很貼近它要表達的意思

恩達舉的例子

查準率的定義是在你的分類器標記為貓的例子中,有多少真的是貓。所以如果分類器a有95%的查準率,這意味著你的分類器說這圖有貓的時候,有95%的機會真的是貓

查全率就是,對於所有真貓的,你的分類器正確識別出了多少百分比。實際為貓的中,有多少被系統識別出來?如果分類器a查全率是90%,這意味著對於所有的影象,比如說你的開發集都是真的貓圖,分類器a準確地分辨出了其中的90%。

當我們使用這兩個指標不能很好判斷乙個模型的好壞,我們就要使用f值去判斷,你可以把它看做這兩個指標的乙個均值,當然這不是嚴格意義上的均值。

training set:顧名思義,是用來訓練模型的。因此它佔了所有資料的絕大部分。

development set:用來對訓練集訓練出來的模型進行測試,通過測試結果來不斷地優化模型。

test set:在訓練結束後對訓練出的模型進行一次最終的評估所用的資料集。

所有資料隨機洗牌,放入開發集和測試集,保證我們的資料來自於同乙個分布。

小資料集(幾千個樣本或者有一萬個樣本):訓練集、測試集三七分;訓練集、開發集和測試集六六二

大資料集(百萬級):98%作為訓練集,1%開發集,1%測試集

機器學習策略

機器學習 machine learning 今天下午,人工智慧老師剛講完機器學習,一想到3月份藍傑那邊上課的時候也通過機器學習的內容,像貝葉斯分類,貝葉斯選擇器之類的,而我自己也沒有系統地總結機器學習的知識,趁著剛吃飽飯的舒服勁,來寫一篇關於機器學習的部落格。what is machine lear...

機器學習ML策略

機器學習ml策略 1 為什麼是ml策略 例如 識別cat分類器的識別率是90 怎麼進一步提高識別率呢?想法 1 收集更多資料 2 收集更多的多樣性訓練樣本 3 使用梯度下降訓練更長時間 4 嘗試adam代替梯度下降 5 嘗試更大的網路 6 嘗試更小的網路 7 嘗試dropout 8 嘗試l2正則化 ...

機器學習 樹的剪枝策略

決策樹剪枝分前剪枝 預剪枝 和後剪枝兩種形式.決策樹為什麼 why 要剪枝?原因是避免決策樹過擬合 overfitting 樣本。前面的演算法生成的決策樹非常詳細並且龐大,每個屬性都被詳細地加以考慮,決策樹的樹葉節點所覆蓋的訓練樣本都是 純 的。因此用這個決策樹來對訓練樣本進行分類的話,你會發現對於...