1、讀入檔案
讀入csv檔案的方式有兩種,一種是pd.dataframe.from_csv(),另一種是pd.read_csv()。
兩種讀入csv檔案的方式本身沒有實質性的區別,二者都基於相同的函式功能實現,但是有一些引數的預設值不同。
推薦使用的是pd.read_csv,pd.dataframe.from_csv存在僅僅是因為歷史原因並(保持對之前專案的支援),所以現在官方準備慢慢停止對pd.dataframe.from_csv的支援,所有新的屬性值只會在pd.read_scv裡面新增。
2、切割dataframe
對於dataframe的切割有兩種方式:
第一種是通過label進行切割,當通過pd.read_csv讀入資料檔案的時候要注意一點,就是這樣讀入的csv檔案會自動填補一行int作為index,這樣只能通過數量進行切割,實際操作的時候會很不方便(我們會想要使用某些標籤的屬性進行切割,例如將時間設定為index的時候,我們將資料按照時間的公升序排列,可以截取出一段時間的資料),這時我們可以使用df.set_index(『index』, inplace=true) 將我們想要的屬性值設定為index。
切割的語法是df.loc[『index1』:『index2』]
注意這樣是返回乙個新的series,不會對原dadaframe進行操作
第二種是通過position進行切割,使用iloc
3、獲取index和column
df.index和df.column可以獲得index和column的值,通過下標的形式可以訪問具體的值
4、選擇特定的屬性
注意當選擇乙個屬性列的時候,用一對方框號返回乙個series,當同時選擇多個屬性列的時候,要用兩對方括號來返回乙個dataframe
df[『column1』]
df[[『column1』, 『column2』]]
csv檔案處理
今天先簡單的使用一些csv檔案處理的一些常用方法,後面使用到numpy pandas等模組時再補充。csv檔案格式的通用標準並不存在,可以參看rfc 4180 逗號分隔值 comma separated values,csv,有時也成為了字元分隔,因為分隔字元也可以不是逗號 其檔案以純文字形式儲存 ...
csv檔案處理
import csv with open stock.csv r as fp reader是乙個迭代器 reader csv.reader fp titles next reader for x in reader print x 這樣操作,以後獲取資料的時候,就要通過下表來獲取資料。如果想要在獲取...
csv檔案處理
import csv with open demo.csv r as fp reader csv.reader fp titles next reader for x in reader print x 這樣操作以後獲取資料的時候,就要通過下標來獲取資料。如果想要在獲取資料的時候通過標題來獲取,那麼...