使用python pandas讀取csv檔案資料

2021-07-30 12:45:53 字數 3682 閱讀 6769

csv

是我接觸的比較早的一種檔案,比較好的是這種檔案既能夠以電子**的形式檢視又能夠以文字的形式檢視。最早接觸是在別人的

perl

指令碼中,或許是為了充分利用

perl

的文字處理能力。不過,日常的生活工作中我用到的比較多的倒還是電子**。

建立乙個電子**如下:

使用mac

中numbers

功能將其匯出為

csv檔案,使用文字檢視檔案內容如下:

greydemac-mini:chapter06 greyzhang$ cat data.csv 

index,name,comment,,,,

1,name_01,coment_01,,,,

2,name_02,coment_02,,,,

3,name_03,coment_03,,,,

4,name_04,coment_04,,,,

5,name_05,coment_05,,,,

6,name_06,coment_06,,,,

7,name_07,coment_07,,,,

8,name_08,coment_08,,,,

9,name_09,coment_09,,,,

10,name_10,coment_10,,,,

11,name_11,coment_11,,,,

12,name_12,coment_12,,,,

13,name_13,coment_13,,,,

14,name_14,coment_14,,,,

15,name_15,coment_15,,,,

16,name_16,coment_16,,,,

17,name_17,coment_17,,,,

18,name_18,coment_18,,,,

19,name_19,coment_19,,,,

20,name_20,coment_20,,,,

21,name_21,coment_21,,,, 換用

pandas

嘗試資料檔案讀取如下:

in [

1]:import

pandas

as

pd

in [

2]: ls

data.csv      data.numbers

in [

3]:

data = pd.read_csv(

'data.csv')

in [

4]:

data

out[

4]: 

index     name    comment  unnamed: 3  unnamed: 4  unnamed: 5  unnamed: 6

0       1  name_01  coment_01         nan         nan         nan         nan

1       2  name_02  coment_02         nan         nan         nan         nan

2       3  name_03  coment_03         nan         nan         nan         nan

3       4  name_04  coment_04         nan         nan         nan         nan

4       5  name_05  coment_05         nan         nan         nan         nan

5       6  name_06  coment_06         nan         nan         nan         nan

6       7  name_07  coment_07         nan         nan         nan         nan

7       8  name_08  coment_08         nan         nan         nan         nan

8       9  name_09  coment_09         nan         nan         nan         nan

9      10  name_10  coment_10         nan         nan         nan         nan

10     11  name_11  coment_11         nan         nan         nan         nan

11     12  name_12  coment_12         nan         nan         nan         nan

12     13  name_13  coment_13         nan         nan         nan         nan

13     14  name_14  coment_14         nan         nan         nan         nan

14     15  name_15  coment_15         nan         nan         nan         nan

15     16  name_16  coment_16         nan         nan         nan         nan

16     17  name_17  coment_17         nan         nan         nan         nan

17     18  name_18  coment_18         nan         nan         nan         nan

18     19  name_19  coment_19         nan         nan         nan         nan

19     20  name_20  coment_20         nan         nan         nan         nan

20     21  name_21  coment_21         nan         nan         nan         nan

檢視讀取出來的結果,看的出結果被處理成了

pandas

的dataframe

格式。

in [

6]: type

(data)

out[

6]:

pandas.core.frame.dataframe

前陣子學習

pandas

的時候這部分功能學的一頭霧水,如今看到這部分真有點束手無策。看來,後面還是得好好學習一下,補一下落下的課程了。

python pandas使用記錄

在使用numpy中array格式的矩陣時,我們通常使用如a 2 4,5 10 獲取陣列中一部分資料,但是dataframe結構的陣列就不能這麼寫,可以使用iloc方法,即index locate,另外有個相似的方法loc,這個方法是通過column名字進行資料定位的 import pandas as...

Python pandas 使用 速查

在注釋中的路徑不能使用 只能用 或者 否則執行的時候還是會報unicode 編譯錯誤 list filter lambda s not s.startswith list0 對 list 進行過濾,返回符合條件的 結果列表 使用 regex 查詢並返回有 orders 的 列表item 返回只有 o...

python pandas基礎使用大全

一 生成資料表 匯入pandas庫 import numpy as np import pandas as pd讀取csv或者excel df pd.read csv a.csv df pd.read csv a.csv header 1 df pd.read csv a.csv 字典轉成dataf...