阿白的機器學習實戰筆記1

2021-08-19 23:35:34 字數 1152 閱讀 5820

python零基礎,啥都不懂的小白,一句句翻譯中。。。
//準備訓練資料集
//包含資料的座標位置,與資料的標籤
def reactedataset():

group = array

lables = ['a','a','b','b']

return group,lables

def classfy0(inx, dataset,lables,k):

datasetsize = dataset.shape[0]//獲取資料集的行數

diffmat = tile(int,(datasetsize,1))-dataset; //將待測資料在行方向擴充套件datasize次,再減去原來的矩陣,得到差矩陣;

sqdiffmat = diffmat**2

sqdistance = sqdiffmat.sum(axis=1)//矩陣的每一行向量相加 即是把每一行的所有資料相加 axis=0按列相加 即是把該列所有資料相加

distance =sqdistance**0.5

sortdistindicies = distance.argsort()//將distance中的元素從小到大排列,提取其對應的index(索引),然後輸出到sortdisdindiccies,它也是個陣列

classcount={}

for i in range(k)

voteilabel = lables[sortdistindicies[i]]

classcount[voteilabel] = classcount.get(voteilabel,0) +1

get(key,default=none)造字典
//依次查詢是否有該key,有則將取出value再+1,沒有則返回新增該key並置value為0,再+1
sortedclasscount = sorted(classcount.iteritems(), //

sortedclasscount是乙個listkey = operator.itemgetter(1),reverse = true)return sortedclasscount[0][0]

機器學習實戰筆記 1 機器學習基礎

監督學習的兩個任務 分類和回歸分析 數值型資料 分類方法思路 這個表至關重要,叫做特徵向量表 特徵1特徵2 目的變數 類別 例項1 例項2 如上表,分類思路如下 用大量的已分類資料 其目標變數的值已給出 組成的訓練集進行訓練,該訓練集由若干個訓練樣本構成,每個訓練樣本是乙個例項 測試樣本 不提供目標...

機器學習實戰學習筆記 1 基礎

1,什麼是機器學習 機器學習,簡單說就是要把無序的資料,轉化為人們可以識別的有用的資料。2,機器學習需要哪些基礎知識 機器學習橫跨很多學科領域,包括但不限於 計算機,數理統計,工程技術等。3,什麼時候可以用機器學習 一般我們寫 解決問題,結果或者計算過程具有確定性。比如計算完全數,水仙花數,或者保險...

機器學習實戰(1)

from numpy import import operator def createdataset object group array 1.0,1.0 1.0,1.1 0,0 0,0.1 labels a a b b return group,labels def classify0 inx,...