機器學習初入門舉例中學習

是英文名稱machine learning(簡稱ml)的直譯機器學習領域，又或者更大而化之的說人工智慧方向，因為「阿爾法狗」等一系列的熱門爆點話題，被推到了人前，受到越來越多人的關注~

無論你是什麼領域的工作者，都一定多多少少聽說過它的名號。

而與此同時，隨著機器學習領域理論的成熟，越來越多的相關技術被應用於生活實踐的方方面面，從事機器學習崗也成了很多計算機行業從業者的重點考慮。

因此接下來我會從我個人實際情況出發，帶大家對「機器學習」進行初入門了解~

這是。。。

這張相信大家都很熟悉，沒錯就是windows phone上的語音助手cortana，當初微軟很晚才推出這款產品，他背後的核心技術理所當然的就是機器學習，它實現了人們一直想要的人機互動。如今各大手機平台上也有了類似的身影，大大方便了人們的日常生活！那它是怎樣像人類那樣學習互動的呢？其實相比傳統的命令式的程式，機器學習用的是使用者傳入的資料。類似於概率推算的過程

舉例說明：例如你喜歡乙個女孩子，而她和你一直相處和諧，於是你決定去向她表達你的想法，這種情況下成功的機率是很大的；然而相反，如果你們初識或者平時也聊不怎麼來，那麼你就得考慮一下了。這個過程其實就和機器學習是類似的，你只要把引數和變數傳入，機器來建立乙個模型，就很可能實現這一過程啦~

我們把機器學習的過程和人類對歷史經驗歸納的過程做個比對。

現在是不是對機器學習有了點興趣呢~

區別

監督學習：

顧名思意就好比有老師的教學，在已有知識背景條件下（老師教你的方法）去套用並訓練這些技能，最終得到這些知識的運用方法,當以後遇到類似的問題，也能用這些模型來處理和解決它；

無監督學習：

自然就是無老師，沒經驗的自學，那麼機器能做到嗎？其實我們日常生活中就無處不在。以我自己為例，平時我對電腦硬體方面很有興趣，算是一種個人愛好吧！當初的我對其還是一片空白是就好比無監督學習，但當我見過並用過許多硬體後，便在心裡產生了好壞的分類區別了，接下來便和監督學習類似了，像有了「模型」。

泛化能力（generalization ability）是指機器學習演算法對新鮮樣本的適應能力。學習的目的是學到隱含在資料背後的規律，對具有同一規律的學習集以外的資料，經過訓練的網路也能給出合適的輸出，該能力稱為泛化能力。通常期望經訓練樣本訓練的網路具有較強的泛化能力，也就是對新輸入給出合理響應的能力。應當指出並非訓練的次數越多越能得到正確的輸入輸出對映關係。網路的效能主要用它的泛化能力來衡量。

對比不同模型的泛化能力時，採用不同的度量方法，往往得到不同的結果，所以什麼樣的資料模型是好的，不僅取決於演算法和資料，還取決於任務需求。下面是回歸任務和分類任務常用的效能度量。

概念：擬合的函式和訓練集誤差較大，我們稱這種情況為 =》欠擬合擬合的函式和訓練集誤差較小，我們稱這種情況為 =》合適擬合擬合的函式完美的匹配訓練集資料，我們稱這種情況為 =》過擬合

欠擬合：

合適擬合：（非完全擬合，和現實相近）

過擬合：（理想模型）

欠擬合問題，根本的原因是特徵維度過少，導致擬合的函式無法滿足訓練集，誤差較大。

欠擬合問題可以通過增加特徵維度來解決。

過擬合問題，根本的原因則是特徵維度過多，導致擬合的函式完美的經過訓練集，但是對新資料的**結果則較差。

解決過擬合問題，則有2個途徑： 1.減少特徵維度; 可以人工選擇保留的特徵，或者模型選擇演算法 2.正則化; 保留所有的特徵，通過降低引數θ的值，來影響模型

5.2.1概念和思維解讀

叉驗證的目的：在實際訓練中，模型通常對訓練資料好，但是對訓練資料之外的資料擬合程度差。用於評價模型的泛化能力，從而進行模型選擇。

交叉驗證的基本思想：把在某種意義下將原始資料(dataset)進行分組,一部分做為訓練集(train set),另一部分做為驗證集(validation set or test set),首先用訓練集對模型進行訓練,再利用驗證集來測試模型的泛化誤差。另外，現實中資料總是有限的，為了對資料形成重用，從而提出k-摺疊交叉驗證。

對於個分類或回歸問題，假設可選的模型為。k-摺疊交叉驗證就是將訓練集的1/k作為測試集，每個模型訓練k次，測試k次，錯誤率為k次的平均，最終選擇平均率最小的模型mi。

解讀，go=>

最後希望各位學得開心！，過好每一天~

機器學習初入門舉例中學習

python VTK 初入門學習

機器學習門徑初窺

初入機器學習（2）

機器學習初入門 舉例中學習

python VTK 初入門學習

機器學習門徑初窺

初入機器學習（2）

相關推薦

機器學習初入門舉例中學習