啞變數的處理

2021-07-26 07:13:48 字數 707 閱讀 8967

library(caret)

將幾個離散變數轉換為因子,目的便於下面一次性處理啞變數

final_housecl

uste

r<−f

acto

r(cl

ust 

cluster)

final_housefl

oow<−f

acto

r(fi

nalh

ouse

floow)

final_housety

pe.n

ew<−f

acto

r(fi

nalh

ouse

type.new)

篩選出所有因子型變數

將因子型變數轉換成公式formula的右半邊形式

formula <- f <- as.formula(paste(『~』, paste(factors, collapse = 『+』)))

dummy <- dummyvars(formula = formula, data = final_house)

pred <- predict(dummy, newdata = final_house)

head(pred)

將啞變數規整到final_house資料集中

final_house2 <- cbind(final_house,pred)

啞變數詳解

它是人為虛設的變數,通常取值為0或1,來反映某個變數的不同屬性。對於有n個分類屬性的自變數,通常需要選取1個分類作為參照,因此可以產生n 1個啞變數。如職業 性別對收入的影響,戰爭 自然災害對gdp的影響,季節對某些產品 如冷飲 銷售的影響等等。這種 量化 通常是通過引入 啞變數 來完成的。根據這些...

將連續的浮點數轉化成啞變數

一二 中每行都有乙個starttime 上線時間 和offlinetime 下線時間 備註 python 中pandas所帶的get dummies會將整個時間作為乙個字串變數,即只能在頭和尾形成啞變數,無法在中間插入數值,為了解決這個問題所以才有了現在這篇部落格 隨意建立兩個資料的 data pd...

variant t 變數的處理

主要用於ado的返回值,為空時的正理 template struct boolpair boolpair t value,bool bvisible m value value m bvisible bvisible operator bool operator t bool m bvisible ...