Python機器學習應用二

2021-08-02 01:19:55 字數 1657 閱讀 7445

分類

評價標準

精確率–以二分類為例,在測試樣本集上,**結果:

正例**為正類(tp),負例**為正類(fp)。如, a–>a(tp正確**),b–>a(fp錯誤**)

p=\franctp

tp+f

p

負例**為負類(tn),正例**為負類(fn)。如, b–>b(tn正確**),a–>b(fn錯誤**) p=

\franctn

tn+f

n

召回率–針對原來的樣本而言,表示樣本中**正確的正例有多少

原來的正例**為正類(tp),原來的正例**為負類(fn) p=

\franctp

tp+f

n

準確率–**正確/所有樣本 p=

\franctp

+tnt

p+fp

+tn+

fnsklearn分類庫

sklearn庫中的分類演算法放在不同的子模組中,主要包括:

k近鄰

樸素貝葉斯

支援向量機

決策樹

神經網路模型 …回歸

回歸定義

了解兩個或多個變數間是否相關、研究其相關方向與強度,並建立數學模型以便觀察特定變數;

回歸分析幫助人們了解在自變數變化時因變數的變化量;

適合對帶有時序資訊的資料進行**或趨勢擬合(如金融領域、交通資料)

sklearn回歸庫

sklearn.linear_model–>線性回歸函式–>

普通線性回歸

嶺回歸

lasso

非線性回歸–>

多項式回歸

sklearn.preprocessing子模組

## 例項說明 ##

對感測器採集的大量資料分析與建模,通過各項特徵的數值進行使用者狀態的判斷,根據使用者所處的狀態提供給使用者更加精準、便利的服務

## 資料介紹 ##

abcde 使用者可穿戴裝置的感測器資料,資料集包括:特徵檔案(a.feature)標籤檔案(a.label)

特徵檔案:每行–乙個時刻的所有感測器數值

標籤檔案:每行–與特徵檔案對應時刻,標記過的使用者姿態

兩檔案行數相同,相同行之間互相對應

41列特徵

溫度資料

反映活動劇烈程度:

靜止狀態時,溫度穩定在36.5度上下;

高於37度時,可能為短時間劇烈運動

加速度資料

兩個型號加速度感測器,互相印證,保證完整性和準確性

加速度感測器對應的三個數值,xyz三個軸上對應的加速度

陀螺儀資料

角運動檢測常用資料,判斷身體角度水平、傾斜、垂直

磁場資料

使用者周圍磁場強度和數值大小,幫助理解使用者周圍環境

磁場改變,使用者的位置和場景發生變化

每行代表與特徵檔案中對應行的使用者姿態類別,共25種

標籤檔案作為訓練集的標準參考準則,可以進行特徵的監督學習

## 任務介紹 ##

1.出現新使用者,如何根據感測器資料,判斷使用者狀態?

2.同一使用者,根據當前資料,判斷新資料的使用者狀態?

Python機器學習應用 Kmeans演算法

import numpy as np from sklearn.cluster import kmeans def loaddata filepath fr open filepath,r 讀寫開啟乙個文字檔案 lines fr.readlines retdata 城市各個消費資料 retcityn...

python機器學習基礎(二)

python機器學習基礎教程 一 k近鄰演算法scikit learn中有很多可用的分類演算法。這裡我們用的是k近鄰分類器,這是乙個很容易理解的演算法。核心思想是 要對乙個新的資料點作出 演算法會在訓練集中尋找與這個新資料點距離最近的資料點,然後將找到的資料點的標籤賦值給這個新資料點。k近鄰演算法中...

Python機器學習基礎(二)

什麼是監督學習?當我們希望通過某些輸入來 對應的輸出,這時候就需要先使用已經存在的輸入 輸出資料對來訓練模型,這些資料對中,每乙個輸入都乙個已知的輸出,我們就是讓機器去學習這其中的規律 基本介紹 監督學習問題主要分為兩種 分類與回歸 分類問題 類別標籤。比如在 一 中實現的鳶尾花分類 回歸問題 乙個...