Kaggle Titanic前三名方法總結

2021-10-18 12:28:32 字數 801 閱讀 5627

進行了資料分析和處理  畫出了很多關係圖  列出了各種不同模型得到的**結果  使用超引數調整模型

具體步驟:

導包 導資料

處理空值

刪除一些特徵

構建新特徵

對一些特徵編碼

分割訓練和測試資料

畫出各種圖來進行資料分析

model:

分訓練集和測試集 留出10%

比較各種方法在測試集上的效果 視覺化

!算拋硬幣的準確率

定義樹的函式 得到準確率

計算混淆矩陣並畫出

使用超引數調整模型(庫中的函式):

調參前的準確率 和 之後的對比

用特徵選擇調整模型(dizzy)

基本沒畫圖 對資料的觀察不是通過**來實現的 是觀察好了再對特徵進行操作

導包 導資料

構建新特徵

處理空值

手動分箱編碼

丟棄一些特徵

皮爾森相關的熱圖

生成模型 

(後面的**報錯)

這個是理解起來最簡單的  資料分析的簡單易懂  有一定的圖形  選用簡單的模型  沒有整合學習

導包 導資料

觀察資料

看不同特徵的各個種類的存活佔比

畫圖 觀察關係

構建特徵 手動分箱

處理空值

用不同的基本方法**資料

選出最優方法

前三正規化概述

1,mysql優化包含的內容,由上到下重要性降低。l 資料庫 表 設計合理,表的設計要符合3nf,有時我們需要適當的逆正規化。l sql語句優化。l 資料的配置。l 適當硬體配置和作業系統。2,第一正規化1nf。1nf是對屬性原子性的約束,要求屬性具有原子性,不可以再分解 只要是關係型資料庫都滿足1...

前三周學習總結

在第一周的學習中,我們對動態 有了乙個比較模糊而又總體的了解。1.比較靜態與動態 的區別 2.安裝tomcat 3.有乙個簡單的小專案實踐 第二週1.利用ij軟體建立專案 2.大致了解jsp元素 jsp元素可以控制呈現的方式與狀態 3.詳細了解jsp元素 模板元素 jsp指令元素 jsp動作元素 第...

Oracle分組取前三

oracle分組取前三 row number over函式的基本用法 語法 row number over partition by column order by column 從1開始,為每一條分組記錄返回乙個數字,相當於row num一樣的東西,之後再取最小的幾個 order by是先把列進行...