csv檔案處理

2021-09-29 04:28:13 字數 974 閱讀 3336

1、讀入檔案

讀入csv檔案的方式有兩種,一種是pd.dataframe.from_csv(),另一種是pd.read_csv()。

兩種讀入csv檔案的方式本身沒有實質性的區別,二者都基於相同的函式功能實現,但是有一些引數的預設值不同。

推薦使用的是pd.read_csv,pd.dataframe.from_csv存在僅僅是因為歷史原因並(保持對之前專案的支援),所以現在官方準備慢慢停止對pd.dataframe.from_csv的支援,所有新的屬性值只會在pd.read_scv裡面新增。

2、切割dataframe

對於dataframe的切割有兩種方式:

第一種是通過label進行切割,當通過pd.read_csv讀入資料檔案的時候要注意一點,就是這樣讀入的csv檔案會自動填補一行int作為index,這樣只能通過數量進行切割,實際操作的時候會很不方便(我們會想要使用某些標籤的屬性進行切割,例如將時間設定為index的時候,我們將資料按照時間的公升序排列,可以截取出一段時間的資料),這時我們可以使用df.set_index(『index』, inplace=true) 將我們想要的屬性值設定為index。

切割的語法是df.loc[『index1』:『index2』]

注意這樣是返回乙個新的series,不會對原dadaframe進行操作

第二種是通過position進行切割,使用iloc

3、獲取index和column

df.index和df.column可以獲得index和column的值,通過下標的形式可以訪問具體的值

4、選擇特定的屬性

注意當選擇乙個屬性列的時候,用一對方框號返回乙個series,當同時選擇多個屬性列的時候,要用兩對方括號來返回乙個dataframe

df[『column1』]

df[[『column1』, 『column2』]]

csv檔案處理

今天先簡單的使用一些csv檔案處理的一些常用方法,後面使用到numpy pandas等模組時再補充。csv檔案格式的通用標準並不存在,可以參看rfc 4180 逗號分隔值 comma separated values,csv,有時也成為了字元分隔,因為分隔字元也可以不是逗號 其檔案以純文字形式儲存 ...

csv檔案處理

import csv with open stock.csv r as fp reader是乙個迭代器 reader csv.reader fp titles next reader for x in reader print x 這樣操作,以後獲取資料的時候,就要通過下表來獲取資料。如果想要在獲取...

csv檔案處理

import csv with open demo.csv r as fp reader csv.reader fp titles next reader for x in reader print x 這樣操作以後獲取資料的時候,就要通過下標來獲取資料。如果想要在獲取資料的時候通過標題來獲取,那麼...