pandas使用的一些技巧

2021-09-30 13:37:41 字數 278 閱讀 7680

偶然學到了一些技巧,不知道寫在哪兒,就記在這吧,持續更新ing…

loc是最慢的。盡量用ix代替。pandas 存在 df.iterrows() 的generator 來迴圈dataframe 的 row, 這樣的效率是最高的。文件丟在這:

轉乙個部落格作為參考:

我用的時候:

for i, row in tqdm(df.iterrows(), total=len(df)): # 獲取每行的index、row

whale_id = row[『whaleid』] …

Pandas的一些技巧分享

pandas 是乙個廣泛應用於資料分析等領域的 python 庫。關於它的教程有很多,但這裡會一些比較冷門但是非常有用的技巧。read csv 這是乙個大家都應該知道的函式,因為它就是讀取 csv 檔案的方法。但如果需要讀取資料量很大的時候,可以新增乙個引數 nrows 5,來先載入少量資料,這可以...

關於pandas的一些使用

該函式只對dataframe或series型別有效,用於去除重複值。引數有三個 舉個例子 dataframe pd.read excel data.xlsx dataframe2 pd.read excel data.xlsx dataframe.drop duplicates subset non...

Pandas處理「大」資料的一些技巧

實習定下來下的空檔期,抽空參加了一些大資料競賽,pandas用的比較多,所以這裡彙總下pandas的一些使用心得和總結一些遇到過的問題吧。import pandas as pd res for dfs in pd.read csv data.csv chunksize 1000 iterator t...