pandas快速入門筆記

2021-10-09 13:40:18 字數 3467 閱讀 5944

"""#pandas 基於numpy,更強大,可以處理有標籤的資料

#serise 帶標籤的一維陣列

import pandas as pd

a = pd.series([1,2,3,4,5])#pd.serise(資料,標籤,型別)

print(a)

b = pd.series([1,2,3,4,5],['a','b','c','d','e'])

print(b)

dic =

c = pd.series(dic)#傳入字典

print(c)

d = pd.series(dic,index=['name','color'])

print(d)

e = pd.series(5,[1,2,3])#自動填充資料

print(e)

#serise只有行名,沒有列名,所以是帶標籤的一維陣列,dataframe是帶標籤的二維陣列(有行名又有列名)

import pandas as pd

import numpy as np

a = np.random.randint(0,10,(2,3))

print(a)

b = pd.dataframe(a,index=['a','b'],columns=['x','y','z'])

print(b)

population = #不能直接向dataframe傳字典資料

c = pd.series(population)

print(pd.dataframe(c))

print(pd.dataframe(c,columns=['population']))#手工設定series資料的列名

#字典方式構建dataframe

gdp = population

print(pd.dataframe())

#多個字典的dataframe

print(pd.dataframe())

print(pd.dataframe())#如果資料是特定資料的話,會填充所有的行(china)

a1 = pd.dataframe()

print(a1.values)#values轉化為numpy資料型別

print(a1.index)#返回行名

print(a1.columns)#返回列名

print(a1.shape)#返回維度

print(a1.size)#元素個數

print(a1.dtypes)#返回每一列資料的型別

import tensorflow as tf

import numpy as np

import pandas as pd

population =

gdp =

a = pd.dataframe()

print(a)

#取列print(a['gdp'])

print(a.gdp)

#取行print(a.loc['beijing'])

print()

#取多行

print(a.loc[['beijing','shanghai']])

#取某元素

print(a.loc['beijing','gdp'])

#索引號取行

print('****',a.iloc[0])#取出第0行

print('\n取多行的時候,使用列表傳入\n',a.iloc[[0,2]])

#values 取值方法(values直接把xx程式設計numpy資料)

print('\n',a.values[0][1])

print('\n\n',a.iloc[:2,:])#取前兩行,列都取

print(a.gdp>0) #對某一行進行操作

print(a[a.gdp>0])

print('\n',a.gdp==243251)

#dataframe賦值

a.iloc[0,1]=9999

print(a)

#dataframe 加一列

a['e']=pd.series([1,2,3],index=['beijing','shanghai','guangzhou'])

print(a)

import pandas as pd

import numpy as np

dates = pd.date_range(start='2020-1-1',periods=6)

print(dates)

df = pd.dataframe(np.random.randint(0,10,(6,4)),index=dates,columns=['a','b','c','d'])#內容,index,columns

print(df)

print(df.describe())#檢視和,平均值,最小值,最大值等資訊

print(df.info())

print(df.head(6))#返回前幾個資料

print(df.tail(1))#返回最後幾個資料

print(df.sort_index(axis=0,ascending=false))#false預設從小到大,

print(df.sort_values('b'))#按照某一列資料進行排序

#計算import pandas as pd

import numpy as np

a = pd.dataframe([1,2,3])

print(a-2)#減運算,直接減乙個數字,表示為每個數字都自減1

b = pd.dataframe([1,2,3])

print(a+b)#兩個張量相加

#矩陣相乘

c = pd.dataframe(np.random.randint(0,10,size=(1,3)))

print(c)

print(a@c)#矩陣相乘符號是艾特

d = pd.dataframe(np.random.randint(0,10,size=(3,3)))

e = pd.dataframe(np.random.randint(0,10,size=(2,2)))

print(d+e)#非數+自然數 = 非數

#缺失值處理

import numpy as np

import pandas as pd

a=pd.dataframe(np.random.randint(0,10,(3,3)))

print(a)

a.iloc[:2,2] = np.nan #將指定數字賦值非數

print(a)

#print(a.dropna()) # 把存在非數nan的行給刪除掉

#print(a.dropna(axis=1)) #把存在nan的列給刪除掉

print(a.dropna(axis=1,how='all'))#只有這一列都是nan的時候才刪除掉

print(a.fillna(value=0))#非數替換為0

"""

Pandas 快速入門

pandas其實很簡單,共有三種資料結構。其中一維為series,二維為dataframe,三維為panel.先說series,numpy陣列,python列表等都可以生成series。它的結構分為兩部分,索引和值。獲取索引的方式為 index 方法,獲取值得方式為values 方法。而資料框又多乙...

快速入門Pandas

教你十分鐘學會使用pandas。pandas是python資料分析的乙個最重要的工具。一般以pd作為pandas的縮寫 import pandas as pd 讀取檔案 df pd.read csv file.csv 返回資料的大小 df.shape 顯示資料的一些物件資訊和記憶體使用 df.inf...

pandas 最全入門學習筆記

方法 讀取csv read csv 引 讀取excel read excel 讀取製表符分割的table read table 引數 encoding 設定檔案編碼 header 設定表頭 sep 設定分割符,sep可以是正規表示式 names 設定列名 index col 設定行索引,可以是多個列...