Pandas DataFrame常用方法

2021-10-12 10:31:22 字數 1289 閱讀 5381

1、獲取列名

1.1.鍊錶推導式

語法:[col for col in df]

返回結果: [『cvr1』, 『cvr2』, 『cvr3』, 『cvr4』]

結果型別:list

1.2.通過columns屬性

columns屬性返回index,

columns.values屬性返回 numpy.ndarray,可通過 tolist(), 或者 list(ndarray) 轉換為list

print

(type

(df.columns)

)print

(type

(df.columns.values)

)print

(type

(df.columns.tolist())

,":"

+"\n"

,df.columns.tolist())

print

(type

(df.columns.values.tolist())

,":"

+"\n"

,df.columns.values.tolist(

))

1.3.直接使用 list ,返回乙個含有columnsd的list列表

print

(list

(df)

)

返回結果: [『cvr1』, 『cvr2』, 『cvr3』, 『cvr4』]

結果型別:list

2、讀取多個檔案,合併到乙個dataframe中

2.1 使用萬用字元讀取多個檔案

2.2 迴圈讀取單個檔案,然後concat到乙個dataframe中

train_data_df = pd.dataframe(

)for train_promotion_tag in promotion_list:

data_csv =

"features_for_.csv"

.format

(job_type=job_type)

print

("讀取檔案"

.format

(data_csv)

) tmp = pd.read_csv(data_csv)

train_data_df = pd.concat(

[train_data_df, tmp]

,ignore_index=

true

)

Pandas DataFrame用法總結

1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...

Pandas DataFrame 按行構建

當我們從複雜 提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。而pandas.dataframe 容許的輸入有numpy ndarray structured or homogeneous dict,or dataframe這些 ...

如何迭代pandas dataframe的行

from 在對dataframe進行操作時,我們不可避免的需要逐行檢視或運算元據,那麼有什麼高效 快捷的方法呢?import pandas as pd inp df pd.dataframe inp for x in xrange len df.index print df c1 iloc x 這似...