Pandas兩種主要的資料結構

2021-08-20 05:15:12 字數 1496 閱讀 1143

pandas中的資料結構主要包括兩種,一種是series,一種是dataframe。

series表示一維資料,可以簡單理解為乙個向量,但是不同於向量的是,series會自動為這一維資料建立行索引。

① 建立series

import pandas as pd

series_obj = pd.series(['a','b','c'])

② series本身的屬性有兩種,一種是index,一種是values

series_obj.index

# 檢視series的index

series_obj.values

# 檢視series的values

③ 檢視series的前幾行

series_obj.head(1) # 可以將1替換成想檢視的任何行數
dataframe是一種**型的資料結構,既有行索引index,也有列索引columns。其實可以簡單把dataframe理解為一張資料表。

① 建立dataframe

通過字典方式建立, key相當於列索引中的每一列的「列名」

data_dict = 

print(data_dict)

通過無索引的資料矩陣,新增columns

a = [[1,2,3],[2,3,4]]

data = pd.dataframe(a,columns=('a','b','c'))

② 同樣地,對於pandas來說,有三種屬性可以呼叫,一是index,二是columns,三是values

③ dataframe的索引問題

按照欄位名稱選列

data['a']  # 找出一列

data[['a','b']] # 找出兩列或多列資料

按照字段位置選列和行

data.loc[0,:]  # 找出某一行的資料

data.loc[[0,1],:] # 找出一二行的資料

找出dataframe的前/後多少行

data.head(2)  # 前兩行

data.tail(2) # 後兩行

④ dataframe的排序問題

data2 = data.sort_index(ascending=false)

data3 = data.sort_values(by='b',ascending=true)

⑤ dataframe的資料新增與刪除

data['d'] = [4,2]

deldata['d']

⑥ dataframe用於資料探索

data.info()

data.describe()

兩種基本的資料結構

棧的基本操作包括入棧push和出棧pop,棧有乙個棧頂指標top,指向最新如棧的元素,入棧和出棧操作操作都是從棧頂端進行的。佇列的基本操作包括入隊enqueue和出隊dequeue,佇列有隊頭head和隊尾tail指標。元素總是從隊頭出,從隊尾入。採用陣列實現佇列時候,為了合理利用空間,可以採用迴圈...

資料結構 兩種常見的查詢演算法

查詢是在大量的資訊中尋找乙個特定的資訊元素,在計算機應用中,查詢是常用的基本運算 順序查詢演算法 演算法思想 演算法實現演算法的c 實現,實現 來自王治和教授資料結構課堂的總結 enum error code error code sequentialsearch int entry,int siz...

Mysql兩種主要資料引擎的區別

innodb和myisam是在使用mysql最常用的兩個表型別,它們各有各的優點,視具體應用而定。innodb引擎 該引擎在5.5後的mysql資料庫中為預設儲存引擎。innodb引擎提供了對資料庫acid事務的支援,並且實現了sql標準的四種隔離級別。該引擎還提供了行級鎖和外來鍵約束,它的設計目標...