csv檔案處理

1、讀入檔案

讀入csv檔案的方式有兩種，一種是pd.dataframe.from_csv()，另一種是pd.read_csv()。

兩種讀入csv檔案的方式本身沒有實質性的區別，二者都基於相同的函式功能實現，但是有一些引數的預設值不同。

推薦使用的是pd.read_csv，pd.dataframe.from_csv存在僅僅是因為歷史原因並（保持對之前專案的支援），所以現在官方準備慢慢停止對pd.dataframe.from_csv的支援，所有新的屬性值只會在pd.read_scv裡面新增。

2、切割dataframe

對於dataframe的切割有兩種方式：

第一種是通過label進行切割，當通過pd.read_csv讀入資料檔案的時候要注意一點，就是這樣讀入的csv檔案會自動填補一行int作為index，這樣只能通過數量進行切割，實際操作的時候會很不方便（我們會想要使用某些標籤的屬性進行切割，例如將時間設定為index的時候，我們將資料按照時間的公升序排列，可以截取出一段時間的資料），這時我們可以使用df.set_index(『index』, inplace=true) 將我們想要的屬性值設定為index。

切割的語法是df.loc[『index1』:『index2』]

注意這樣是返回乙個新的series，不會對原dadaframe進行操作

第二種是通過position進行切割，使用iloc

3、獲取index和column

df.index和df.column可以獲得index和column的值，通過下標的形式可以訪問具體的值

4、選擇特定的屬性

注意當選擇乙個屬性列的時候，用一對方框號返回乙個series，當同時選擇多個屬性列的時候，要用兩對方括號來返回乙個dataframe

df[『column1』]

df[[『column1』, 『column2』]]

csv檔案處理

csv檔案處理

csv檔案處理

csv檔案處理

相關推薦