Python 常用資料處理

2021-08-29 16:00:23 字數 478 閱讀 5693

以下為積累 python 常用資料處理方法,不定時更新。

1.遍歷某資料夾下所有檔案 :

files= os.listdir(path)

2.取消科學計數法:

np.set_printoptions(suppress=true), df[『a』].astype(『int64』)

3.判斷 dataframe 為空:

全部資料集 df.isnull()

為空的列 df.isnull().any()

挑選某一列為空的行 df[df[『a』].isnull().values == true]

某一元素為空:np.isnan(x), x is np.nan

(一件有意思的事情是,np.nan == np.nan, np.nan is np.nan, np.isnan(np.nan) 的結果是不同的

)6.list擷取:

list[m:n],顧頭不顧尾,末尾的值不被包含進來

資料處理常用

1,dataframe獲取列名稱 dataframe.columns.values.tolist 2,dataframe轉化為numpy dataframe.values 轉化為陣列後可以進行數值計算 3,numpy轉化為列表 list numpy.tolist 4,進行陣列運算時如果有字串 nul...

Python資料處理pandas常用方法

1 時間序列化 periodindex 2 變更列名 rename df.rename columns inplace true 3 對某列執行特定函式 agg df.groupby 貨主 英文列名.agg sum mean max min 4 排序 sort values ascending如果都...

Python 資料處理

將檔案切分,存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...