5 23學習筆記(pandas)

2021-09-23 13:31:17 字數 1657 閱讀 1077

pandas資料結構:系列,資料幀,面板。較高維資料結構是其較低維資料結構的容器

|資料結構 |維數 |描述

|系列|1|1d標記均勻陣列,大小不變

|資料幀 |2 |一般2d標記,大小可變的表結構與潛在的異質型別的列

|面板|3|一般3d標記,大小可變陣列

特性:可變性:所有pandas的資料結構是值可變的(可以更改),除了系列都是大小可變的,系列是大小不變的

系列

系列:具有均勻資料的一維陣列結構

關鍵點:均勻資料,尺寸大小不變,資料的值可變

資料幀

資料幀是乙個具有異構資料的二維陣列。各列資料型別可以不同

關鍵點:異構資料,大小可變,資料可變

面板

面板是具有異構資料的三維資料結構。在圖形表示中很難表示面板,但是乙個面板可以說明為dataframe的容器。

關鍵點:異構資料,大小可變,資料可變

建立series物件

import pandas as pd

s = pd.series([1,3,4,np.nan,6,8])

print(s)

結果:

0 1.0

1 3.0

2 4.0

3 nan

4 6.0

5 8.0

dtype: float64

建立dataframe物件

import pandas as pd

dates=pd.date_range('20190301',periods=7)

df=pd.dataframe(np.random.randn(7,4),index=dates,columns=list('abcd'))

print(df)

通過轉換字典來建立dataframe

df2=pd.dataframe()
結果:

a b c d e f

0 1.0 2019-03-02 1.0 3 test foo

1 1.0 2019-03-02 1.0 3 train foo

2 1.0 2019-03-02 1.0 3 test foo

3 1.0 2019-03-02 1.0 3 train foo

檢視框架的頂部和底部的資料行

dates=pd.date_range('20190301',periods=7)

df=pd.dataframe(np.random.randn(7,4),index=dates,columns=list('abcd'))

print(df.head()) //預設前五行

print(df.tail(3))

df.index //檢視行名

df.columns //檢視列名(表頭)

df.values //檢視列表值

df.describe() //描述統計資訊(以列作為單位,元素數,平均值,標準差,最小值,25%,50%(中位數),75%,最大值)

df.t //檢視轉置

pandas學習筆記

import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...

pandas學習筆記

1 建立物件,瀏覽資料 建立物件,瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...

pandas學習筆記

1.series 類似numpy中的一維陣列,表示為索引 從0開始 和值。建立 import pandas as pd,numpy as np s1 pd.series np.arange 10 s2 pd.series 12 2,5 s3 pd.series 含有的屬性 s1.values s1....