資料分析 Day04

2021-10-09 18:49:27 字數 788 閱讀 3796

1.刪除重複行

刪除重複行的處理步驟:

1.判斷重複項

2.重複項處理:

1/ 取非重複項

cond = df.duplicated() # 引數:keep=last/subset=['a', 'b', 'c']

2/ 刪除重複項

df.loc[~cond]/df.drop_duplicates()

2. 對映

2.1 替換元素

df.replace()

2.2 新建一列

df['python'] = df['math'].map() # 引數還可以lambda x:x*2 和 fn

2.3 替換索引

df.rename(index=, columns=)

3.異常值的檢測和過濾

1. 檢測

cond = df.abs()>3*df.std()

cond = cond.any(axis=1)

cond

2.過濾

df.loc[~cond]

4. 抽樣

df.take([1, 0, 2, 3], axis=0) # 引數還可以np.random.permutation([0, 1, 2, 3], axis=0) 和 np.random.randint(0, 4, size=4)

高階資料聚合

weight_sum.add_prefix(『abc_』) # 加字首

weight_sum.add_suffix(』_sum』) # 加字尾

day04 資料寬度

第4節 資料寬度 資料寬度 在上節課了解0和1的關係,同時計算機儲存資料,不是無限制可以儲存任意資料的,在我們現實中只儲存乙個數字的話,要麼把數字寫到本子上或記錄到腦子裡,那麼把它看成無限大的,但是在計算機中不是這樣的由於計算機受到硬體的約束,我們在儲存資料的時候它是有長度限制的。我們稱這個長度的限...

Day04 迴圈結構

如果在程式中我們需要重複的執行某條或某些指令,例如用程式控制機械人踢足球,如果機械人持球而且還沒有進入射門範圍,那麼我們就要一直發出讓機械人向球門方向奔跑的指令。當然你可能已經注意到了,剛才的描述中其實不僅僅有需要重複的動作,還有我們上乙個章節講到的分支結構。再舉乙個簡單的例子,比如在我們的程式中要...

遊戲開發Day04

1.建立球體物件,給球體新增剛體,材質,然後新增到預製體中。2.在相機的射擊指令碼中重寫重寫update方法 public transform newobject void update 3.銷毀子彈物件 在子彈的預製體中新增指令碼 void rotate 向右旋轉 if input.getkey ...