100天搞定機器學習 Day2簡單線性回歸分析

2022-06-05 18:54:07 字數 2414 閱讀 6843

第一天機器學習100天|day1資料預處理,我們學習了資料預處理。知道了,資料預處理是機器學習中最基礎和最麻煩,未來占用時間最長的一步操作。資料預處理一般有六個步驟,導入庫、匯入資料集、處理缺失值、分類資料轉化、分出訓練集和測試集、特徵縮放等。在處理資料過程中,必須得兩個庫是numpy和pandas,也用到sklearn.preprocessing中的imputer,labelencoder, onehotencoder,standardscaler。

機器學習演算法python實現--線性回歸分析

很早之前還用r做過乙個r語言教程之-線性回歸

下面開始,四步搞定簡單線性回歸分析

第一步:資料預處理

第二步:訓練集使用簡單線性回歸模型來訓練

sklearn是機器學習的神器,之前有過介紹

sklearn包含的常用演算法

linearregression(fit_intercept=true, normalize=false, copy_x=true, n_jobs=1)

fit_intercept:是否計算截距。

normalize: 當fit_intercept設定為false時,該引數將被忽略。 如果為真,則回歸前的回歸係數x將通過減去平均值並除以l2-範數而歸一化。

copy_x:布林數,可選,預設為真,如果為真,x會被拷貝,反之,會被覆蓋。

n_jobs:指定執行緒數

第三步:**結果

linearregression官網有具體用法,比較簡單,不想移步的同學只需知道下面幾個用法即可

fit(x,y,sample_weight=none):x,y以矩陣的方式傳入,而sample_weight則是每條測試資料的權重,同樣以array格式傳入。

predict(x):**方法,將返回**值y_pred

score(x,y,sample_weight=none):評分函式,將返回乙個小於1的得分,可能會小於0

y_pred = regressor.predict(x_test)

第四步:視覺化

訓練集結果視覺化

測試集結果視覺化

機器學習100天(Day 2)

今天的學習內容是簡單線性回歸,簡單了說就是一次線性回歸。直接上 吧!step 1 import pandas as pd import numpy as np import matplotlib.pyplot as plt dataset pd.read csv studentscores.csv ...

100天搞定機器學習 Day2簡單線性回歸分析

第一天機器學習100天 day1資料預處理,我們學習了資料預處理。知道了,資料預處理是機器學習中最基礎和最麻煩,未來占用時間最長的一步操作。資料預處理一般有六個步驟,導入庫 匯入資料集 處理缺失值 分類資料轉化 分出訓練集和測試集 特徵縮放等。在處理資料過程中,必須得兩個庫是numpy和pandas...

100天搞定機器學習

新增好友麻煩備註 github 100天搞定機器學習 day1資料預處理 100天搞定機器學習 day2簡單線性回歸分析 100天搞定機器學習 day3多元線性回歸 100天搞定機器學習 day4 6 邏輯回歸 100天搞定機器學習 day7 k nn 100天搞定機器學習 day8 邏輯回歸的數學...