Pandas資料處理(一)

2021-10-02 23:56:20 字數 2054 閱讀 7290

pandas資料處理(一)

import pandas as pd

import numpy as np

#利用numpy生成一組datafrome資料

df=pd.dataframe(np.arange(16).reshape(4,4))

print(df)

–out

0 1 2 3

0 0 1 2 3

1 4 5 6 7

2 8 9 10 11

3 12 13 14 15

#我們看到有一行,豎我們沒有指定沒結果卻出現了,

#那因為datafrome是我們的二維數列,產生了行索引和豎索引

#當然我們也可以指定索引數值

df=pd.dataframe(np.arange(16,32).reshape(4,4),index=[『a』,『b』,『c』,『d』],columns=[『w』,『x』,『y』,『z』])

print(df)

–out

w x y z

a 16 17 18 19

b 20 21 22 23

c 24 25 26 27

d 28 29 30 31

#datafrome 匯入字典a=

df=pd.dataframe(a)

print(df)

–out

id name ***

0 001 小貓 女

1 002 小狗 男

2 003 小狼 男

#pandas果然功能強大,這也是我非常喜歡的乙個地方

#檢視行索引

print(df.index)

–out

rangeindex(start=0, stop=3, step=1)

#檢視列索引

print(df.columns)

–out

index([『id』, 『name』, 『***』], dtype=『object』)

#檢視資料

print(df.values)

–out

[[『001』 『小貓』 『女』]

[『002』 『小狗』 『男』]

[『003』 『小狼』 『男』]]

#檢視型別

print(type(df))

–out

#檢視列表中資料型別

print(type(df))

–out

id object

name object

*** object

dtype: object

#檢視資料維度

print(df.shape)

–out

(3, 3)

#按要求顯示資料

print(df.head(1))

–out

id name ***

0 001 小貓 女

#顯示倒數第一行

print(df.tail(1))

–out

id name ***

2 003 小狼 男

#顯示列表資訊

print(df.info())

–out

rangeindex: 3 entries, 0 to 2

data columns (total 3 columns):

0 id 3 non-null object

1 name 3 non-null object

2 *** 3 non-null object

dtypes: object(3)

memory usage: 200.0+ bytes

none

Pandas資料處理(一)

pandas是非常著名的開源資料處理庫,我們可以通過它完成對資料集進行快速讀取 轉換 過濾 分析等一系列操作。除此之外,pandas 擁有強大的缺失資料處理與資料 可謂是資料預處理中的必備利器。特有的資料結構是 pandas 的優勢和核心。我們可以將任意格式的資料轉換為 pandas 的資料型別,並...

pandas 資料處理

pandas中資料可以分為series,dataframe,panel分別表示一維至三維資料。其中在構造時,index表示行名,columns表示列名 構造方式 s pd.series data index index s pd series np random randn 5 index a b ...

pandas資料處理

dataframe.duplicated subset none,keep first 判斷dataframe中的資料是否有重複 必須一行中所有資料都重複才算重複,只能判斷行,不能判斷列 返回series dataframe.drop duplicates subset none,keep firs...