入門學習(二)Pandas

2021-08-24 17:40:27 字數 3897 閱讀 5738

import pandas as pd

import numpy as ny

trucks = data

('trucks')

print(trucks)

所得如下:

1712

before

back yes daylight

2613

after

back yes daylight

3192

before forward yes daylight

4179

after forward yes daylight

52557

before

back no daylight

62373

after

back no daylight

710749

before forward no daylight

89768

after forward no daylight

9634

before

back yes night, illuminate

10411

after

back yes night, illuminate

1195

before forward yes night, illuminate

1255

after forward yes night, illuminate

13325

before

back no night, illuminate

14283

after

back no night, illuminate

151256

before forward no night, illuminate

16987

after forward no night, illuminate

17345

before

back yes night, dark

18179

after

back yes night, dark

1946

before forward yes night, dark

2039

after forward yes night, dark

21579

before

back no night, dark

22494

after

back no night, dark

231018

before forward no night, dark

24885

after forward no night, dark

3.1提取單列

print(trucks.period[2:5])  #第三到五行

或者print(trucks['period'][2:5]) #[ ]裡面是索引的名稱,字串,要加''

得到:

3

before

4after

5before

name: period, dtype: object

#一維的資料,會自動列印成一列的資料,並在最後標明該列的索引名

3.2提取行、列、單個資料

行、列:

#為適應使用者習慣,iloc左邊右開,自+1;loc是鎖定,不會+1

print(trucks.iloc[2:5, 2:]) #列印3-5行,從第三列開始往後

print(trucks.loc[1]) #列印第一行,一維會自行轉置

得到:

collision parked   light    wheelers

3forward yes daylight true

4forward yes daylight true

5 back no daylight true

freq 712

period before

collision back

parked yes

light daylight

wheelers true

name: 1, dtype: object

或者使用column

dataframes有乙個變數叫columns,這個是儲存了所有的列索引,如果你要擷取某幾個,只要拿到columns這個陣列就行,擷取裡面的元素

columns = trucks.columns                

columns = columns[1:] #擷取第二列之後

print(trucks.loc[2:5, columns])

單個資料:
print(trucks.collision[1])

print(trucks.freq[3])

得到:

#collision列第乙個

1923.3增、減、插入行/列

增加:

trucks['wheelers']= true     #列索引為「wheelers」,每行的值為true,預設增加在最後一列
刪除:

trucks = trucks.drop(1)    #刪除第一行

del trucks['freq'] #刪除列標籤為'freq'的這一列

插入:

series 一維

dataframe 二維

panel 三維

4.1series

data = np.array(['a','b','c','d'])

s = pd.series(data) #索引預設為 0 to len(data)-1

print(s)

得到:0 a

1 b

2 c

3 d

dtype: object

#加上索引

s = pd.series(data,index=[100,101,102,103])

print(s)

得到:100 a

101 b

102 c

103 d

dtype: object

4.2dataframe
data = [['alex',10],['bob',12],['clarke',13]]

df = pd.dataframe(data,columns=['name','age'])

print(df)

得到:

name  age

0 alex 10

1 bob 12

2 clarke 13

pandas入門學習一

本文是學習 利用python進行資料分析 的部分筆記,在這裡感謝作者。一 匯入pandas from pandas import series,dataframe import pandas as pd二,series的有關介紹 series類似於一維陣列,它由一組資料以及一組與之相關的索引組成。由...

pandas入門學習01

pandas底 層是numpy,pandas的操作 pandas.read csv 目錄檔案 讀取csv格式的檔案 pandas裡面字元型是object,不是string pandas.read csv 目錄檔案 head x 大致顯示內容,x可以指定也可以不指定,如果指定則顯示x行 pandas....

pandas 最全入門學習筆記

方法 讀取csv read csv 引 讀取excel read excel 讀取製表符分割的table read table 引數 encoding 設定檔案編碼 header 設定表頭 sep 設定分割符,sep可以是正規表示式 names 設定列名 index col 設定行索引,可以是多個列...