pandas快速入門筆記

"""#pandas 基於numpy，更強大，可以處理有標籤的資料
#serise 帶標籤的一維陣列
import pandas as pd
a = pd.series([1,2,3,4,5])#pd.serise(資料，標籤，型別)
print(a)
b = pd.series([1,2,3,4,5],['a','b','c','d','e'])
print(b)
dic = 
c = pd.series(dic)#傳入字典
print(c)
d = pd.series(dic,index=['name','color'])
print(d)
e = pd.series(5,[1,2,3])#自動填充資料
print(e)
#serise只有行名，沒有列名，所以是帶標籤的一維陣列，dataframe是帶標籤的二維陣列（有行名又有列名）
import pandas as pd
import numpy as np
a = np.random.randint(0,10,(2,3))
print(a)
b = pd.dataframe(a,index=['a','b'],columns=['x','y','z'])
print(b)
population = #不能直接向dataframe傳字典資料
c = pd.series(population)
print(pd.dataframe(c))
print(pd.dataframe(c,columns=['population']))#手工設定series資料的列名
#字典方式構建dataframe
gdp = population
print(pd.dataframe())
#多個字典的dataframe
print(pd.dataframe())
print(pd.dataframe())#如果資料是特定資料的話，會填充所有的行（china）
a1 = pd.dataframe()
print(a1.values)#values轉化為numpy資料型別
print(a1.index)#返回行名
print(a1.columns)#返回列名
print(a1.shape)#返回維度
print(a1.size)#元素個數
print(a1.dtypes)#返回每一列資料的型別
import tensorflow as tf
import numpy as np
import pandas as pd
population = 
gdp = 
a = pd.dataframe()
print(a)
#取列print(a['gdp'])
print(a.gdp)
#取行print(a.loc['beijing'])
print()
#取多行
print(a.loc[['beijing','shanghai']])
#取某元素
print(a.loc['beijing','gdp'])
#索引號取行
print('****',a.iloc[0])#取出第0行
print('\n取多行的時候，使用列表傳入\n',a.iloc[[0,2]])
#values 取值方法（values直接把xx程式設計numpy資料）
print('\n',a.values[0][1])
print('\n\n',a.iloc[:2,:])#取前兩行，列都取
print(a.gdp>0) #對某一行進行操作
print(a[a.gdp>0])
print('\n',a.gdp==243251)
#dataframe賦值
a.iloc[0,1]=9999
print(a)
#dataframe 加一列
a['e']=pd.series([1,2,3],index=['beijing','shanghai','guangzhou'])
print(a)
import pandas as pd
import numpy as np
dates = pd.date_range(start='2020-1-1',periods=6)
print(dates)
df = pd.dataframe(np.random.randint(0,10,(6,4)),index=dates,columns=['a','b','c','d'])#內容，index，columns
print(df)
print(df.describe())#檢視和，平均值，最小值，最大值等資訊
print(df.info())
print(df.head(6))#返回前幾個資料
print(df.tail(1))#返回最後幾個資料
print(df.sort_index(axis=0,ascending=false))#false預設從小到大，
print(df.sort_values('b'))#按照某一列資料進行排序
#計算import pandas as pd
import numpy as np
a = pd.dataframe([1,2,3])
print(a-2)#減運算，直接減乙個數字，表示為每個數字都自減1
b = pd.dataframe([1,2,3])
print(a+b)#兩個張量相加
#矩陣相乘
c = pd.dataframe(np.random.randint(0,10,size=(1,3)))
print(c)
print(a@c)#矩陣相乘符號是艾特
d = pd.dataframe(np.random.randint(0,10,size=(3,3)))
e = pd.dataframe(np.random.randint(0,10,size=(2,2)))
print(d+e)#非數+自然數 = 非數
#缺失值處理
import numpy as np
import pandas as pd
a=pd.dataframe(np.random.randint(0,10,(3,3)))
print(a)
a.iloc[:2,2] = np.nan #將指定數字賦值非數
print(a)
#print(a.dropna()) # 把存在非數nan的行給刪除掉
#print(a.dropna(axis=1)) #把存在nan的列給刪除掉
print(a.dropna(axis=1,how='all'))#只有這一列都是nan的時候才刪除掉
print(a.fillna(value=0))#非數替換為0
"""

Pandas 快速入門

pandas其實很簡單，共有三種資料結構。其中一維為series,二維為dataframe,三維為panel.先說series，numpy陣列，python列表等都可以生成series。它的結構分為兩部分，索引和值。獲取索引的方式為 index 方法，獲取值得方式為values 方法。而資料框又多乙...

快速入門Pandas

教你十分鐘學會使用pandas。pandas是python資料分析的乙個最重要的工具。一般以pd作為pandas的縮寫 import pandas as pd 讀取檔案 df pd.read csv file.csv 返回資料的大小 df.shape 顯示資料的一些物件資訊和記憶體使用 df.inf...

pandas 最全入門學習筆記

方法讀取csv read csv 引讀取excel read excel 讀取製表符分割的table read table 引數 encoding 設定檔案編碼 header 設定表頭 sep 設定分割符,sep可以是正規表示式 names 設定列名 index col 設定行索引,可以是多個列...

pandas快速入門筆記

Pandas 快速入門

快速入門Pandas

pandas 最全入門學習筆記

相關推薦