機器學習筆記

2022-05-24 21:27:09 字數 618 閱讀 9558

機器學習常見演算法:

k最近鄰演算法,線性模型,樸素貝葉斯,決策樹,隨機森林,svms,神經網路等

要注意關心如下問題:

要了解每種演算法的基本原理和用途,它的特性分別是什麼?在不同的資料集中表現如何,如何使用它們建模,模型的引數如何調整等

kaggle大賽,使用來自真實世界的資料磨鍊自己的技能

必要庫的介紹:

numpy: 基礎科學計算庫。功能包括高維陣列、線代計算,傅利葉變換以及生產偽隨機數等等。是scikit-learn的基礎

scipy: 強大的科學計算工具集,sk需要使用scipy裡面的sparse函式生成稀疏矩陣

pandas: 資料分析的利器

scikit-learn----非常流行的機器學習庫,建立在scipy基礎上

scikit-learn擁有眾多頂級機器學習演算法,主要有六大類:分類,回歸,聚類,資料降維,模型選擇和資料預處理

使用者社群需要經常逛一下!!

2018-10-16    

21:26:03

k近鄰演算法

k的含義:最近鄰的個數。如下圖,k的選取值為1,3時候,對於紅o的的分類是不一樣的

在scikit_learn 中,k值是通過n_neighbors引數來調節的

機器學習學習筆記

2.機器學習書籍 機器學習tom,這個是老經典,就是翻譯欠佳 prml,這個書正版的超貴,但是比較新且系統,可以通過其他途徑搞個副本。3.自己動手編碼實現2 3種經典演算法,比如svm,lr,bpnn等。4.了解spark上目前支援的機器學習方法的用途和用法,這個在日常工作中會用到。知道的多一點,方...

機器學習 學習筆記

關於梯度下降演算法的優化與 會有三種方法優化梯度下降演算法 1.共軛梯度下降法 conjugate 2.變尺度法 bfgs 3.限制變尺度法 l bfgs 這些方法的好處是 1.不用選擇學習速率 2.收斂的速度快,執行效率高 但是她們的缺點在於 實現她們的方法太複雜,所以我們就可以使用語言的內建庫函...

機器學習 學習筆記

監督學習 我們的學習演算法使用的資料是給出正確答案的資料,然後我們執行學習演算法,出更多的正確答案。理解為像深度需學習類似,利用訓練樣本訓練處學習模型,然後用測試樣本對學習到的模型進行檢測,輸出 結果。無監督學習 可以理解為對於學習演算法所使用的資料集並沒有給出正確答案,學習演算法就是要對這資料集進...