pandans對某一列進行獨熱編碼

2021-08-31 03:03:18 字數 541 閱讀 3002

需求:將資料集一列進行獨熱編碼

(1)如果所有取值都出現在所在列,則:

from sklearn.preprocessing import onehotencoder

enc = onehotencoder(sparse = false)

result = enc.fit_transform(data[[41]]) #41指的是列標為41的那一列資料

(2)如果所有取值未完全出現在所在列,意思就是說:比如我們想編碼到10種分類,但是資料只出現了6種分類,則:

from sklearn.preprocessing import onehotencoder

enc = onehotencoder(sparse = false)

enc.fit([[0], [1], [2], [3], [4], [5], [6], [7], [8], [9]])

result = enc.transform(data[[41]]) #注意這個函式少了fit字首

pandas對某一列資料進行處理

今天遇到乙個問題,小記錄一下處理過程,現在要將乙個pandas變數的某個字段進行轉換。定義處理方法,至少要有乙個入參,然後有返回內容 此處示例是通過判斷乙個字串裡面是否含有某個字,然後轉換為1或0 def processmethod d str int print d if d.find somet...

C 中對ListView某一列進行重新整理

很簡單,listview.beginupdate for int i 0 i stringlist.length i 只對第三列進行重新整理 listview.endupdate items i subitems j text即為第i 1行的第j 1列的文字。需要注意的是重新整理的列事先應該有定義,...

spark給某一列字段進行加密

有一些資料存在一些敏感資料,需要進行一些特殊處理,比如身份證號,可以用hash演算法或者md5進行加密,我用的處理方式是將加密演算法自定義成udf函式,拿md5舉例子,直接上 加密演算法 def hashmd5 content string string dataset 資料集 colname 要加...