零基礎入門資料探勘 Task1 賽題理解

2021-10-04 07:21:37 字數 608 閱讀 8099

賽題:零基礎入門資料探勘 - 二手車交易****

比賽要求參賽選手根據給定的資料集,建立模型,最終**二手汽車的交易**。

資料來自ebay kleinanzeigen報廢的二手車,數量超過 370,000,包含 20 列變數資訊,為了保證 比賽的公平性,將會從中抽取 10 萬條作為訓練集,5 萬條作為測試集 a,5 萬條作為測試集 b。同時會對名稱、車輛型別、變速箱、model、燃油型別、品牌、公里數、**等資訊進行脫敏。

name - 汽車編碼

regdate - 汽車註冊時間

model - 車型編碼

brand - 品牌

bodytype - 車身型別

fueltype - 燃油型別

gearbox - 變速箱

power - 汽車功率

kilometer - 汽車行駛公里

notrepaireddamage - 汽車有尚未修復的損壞

regioncode - 看車地區編碼

seller - 銷售方

offertype - **型別

creatdate - 廣告發布時間

price - 汽車**

數字全都脫敏處理,都為數字形式。

零基礎入門CV賽事 Task1 賽題理解

賽題名稱 零基礎入門cv之街道字元識別 賽題目標 通過這道賽題可以引導大家走入計算機視覺的世界,主要針對競賽選手上手視覺賽題,提高對資料建模能力。賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。為了簡化賽題難度,賽題資料採用公開資料集svhn,因此大家...

零基礎入門CV賽事 Task1 賽題理解

賽題目標 通過這道賽題可以引導大家走入計算機視覺的世界,主要針對競賽選手上手視覺賽題,提高對資料建模能力。賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。import json train json json.load open r d study c...

零基礎入門CV賽事 Task1 賽題理解

賽題名稱 零基礎入門cv之街道字元識別 賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。注意 按照比賽規則,只能使用比賽給定的資料集完成訓練,不能使用svhn原始資料集。訓練集包括3w張 驗證集包括1w張 每張 包括顏色影象和對應的編碼類別和具體位置 ...