資料探勘實訓週報week8

2021-10-10 14:59:53 字數 397 閱讀 9627

本週理論學習主要學了特徵組合

特徵交叉一種合成特徵的方法,可以在多維特徵資料集上,進行很好的非線性特徵擬合。假設乙個資料集有特徵x1和x2,那麼引入交叉特徵值x3,使得:

x3=x1x2

那麼最終的表示式為:

y=b+w1x1+w2x2+w3x3

使用one-hot向量的方式進行特徵交叉。這種方式一般適用於離散的情況,很少用於連續的資料集上。我們可以把特徵交叉看成資料的邏輯與操作。

在地圖的方面的處理中,需要用到特徵交叉。下圖的房價和經緯度中,單純的給出經度或者緯度,都不能直接反應房價和地理位置的關係。更好的方式為經度和緯度交叉點,才能表示位置。

資料探勘實訓週報1

資料探勘實訓週報1 本階段工作內容 報名官網 二 配置本機環境。三 學習資料探勘涉及的主要python包。1.numpy 學習鏈結1 學習鏈結2 numpy提供了大量的庫函式和操作,主要用於對多維陣列執行計算,以及對影象的處理和其他數 算。基本操作 import numpy as np array ...

專案實訓週報 一

經過兩個星期的時間,我們小組初步完成了我們專案的需求分析和概要設計。專案名稱叫科研專案管理系統,實現把系統管理員 校領導 教育廳評審人員 科研專案的部分管理工作整合到乙個統一的平台,各管理人員分工協作 相互配合,及時了解科研專案進展情況。我負責的是專案結題管理的子模組,通過小組討論和孫老師的講解,我...

綜合實訓週報一

本週的理論學習主要在於學習資料探勘相關的知識,由於本人之前並沒有上過 資料探勘導論 這門課程,導致有許多的知識點都並不了解。所以本週的主要任務就是將資料探勘大概流程,所需要用到的知識大致的過了一遍。實踐學習本週主要是將該練習賽的內容看了一遍,了解了比賽相關的學習資料。之後嘗試進行相應操作,主要是進行...