《資料探勘》組隊學習打卡1

2021-10-04 05:01:54 字數 988 閱讀 7876

有幸在組隊最後時刻加入戰隊,開始一段新的學習旅程。

目前已完成task1的學習,關於賽題理解部分,本賽題屬於比較簡單的基礎型專案,適合作為入門。

#檢視訓練/測試資料概況:

import numpy as np

import pandas as pd

path=』./data/』

train_data=pd.read_csv(path+『used_car_train_20200313.csv』,sep=』 『)

test_data=pd.read_csv(path+『used_car_testa_20200313.csv』,sep=』 ')

print(『train data shape:』,train_data.shape)

print(『testa data shape:』,test_data.shape)

print(train_data.info())

print(train_data.columns)

print(train_data.describe())

#關於衡量指標:

import numpy as np

from sklearn.metrics import accuracy_score

from sklearn import metrics

y_pred=[0,1,0,1]

y_true=[0,1,1,1]

print(「acc:」,accuracy_score(y_pred,y_true))

y_pred=[0,1,0,0]

y_true=[0,1,0,1]

print(『precision:』,metrics.precision_score(y_true,y_pred))

print(『recall:』,metrics.recall_score(y_true,y_pred))

print(『f1-score』,metrics.f1_score(y_true,y_pred))

《資料探勘》組隊學習第四次打卡

一 學習內容 task4 建模調參 線性回歸模型 模型效能驗證 嵌入式特徵選擇 模型對比 模型調參 model linearregression normalize true model model.fit train x,train y print intercept model.intercep...

《機器學習基礎》組隊學習打卡1

本節內容 線性回歸的概念 主要學習以下5個方面 1 線性回歸的一般形式 有資料集 其中,1 2 3 其中n表示變數的數量,d表示每個變數的維度。2 線性回歸損失函式 代價函式 目標函式 損失函式 loss function 度量單樣本 的錯誤程度,損失函式值越小,模型就越好。代價函式 cost fu...

組隊學習 分治演算法 打卡

將原本複雜的問題,拆分成相同解決方法的簡單的小問題,然後將小問題的答案歸併成初始問題的解。採用遞迴的方式,將問題層層分解,直到子問題滿足設定好的終止條件結束遞迴求解子問題的解,然後將解歸併。示意圖如下 示例1 輸入 3,2,3 輸出 3 示例2 輸入 2,2,1,1,1,2,2 輸出 2 首先想到的...