pandas資料結構知識點

2021-10-05 16:36:21 字數 2527 閱讀 2118

pandas資料結構

1、引言

➢pandas 是基於numpy的一-種工具,該工具是為了解決資料分析任務而建立的。

➢pandas納入了大量庫和一-些標準的資料模型,提供了高效地操作大型資料集所需的工具。

➢pandas 提供了大量能使我們快速便捷地處理資料的函式和方法。

➢pandas是python的一-個資料分析包,最初於2023年4月開發,2023年底開源,目前由pydata開發團隊繼續開發和維護。

➢pandas最初被作為金融資料分析i具而開發出來,也為時間序列分析提供了很好的支援。

2、pandas庫介紹

◆pandas是python第三方庫,提供高效能易用資料型別和分析工具

◆pandas基於numpy實現,常與numpy和matplotlib一同使用

◆pandas中有兩大核心資料結構: series(-維資料)和dataframe (多特徵資料,既有行索引,又有列索引)

3、pandas庫介紹

◆series:

➢–維陣列,與numpy中的一-維array類似。

➢series、 numpy中的一維array與 python基本的資料結構list 也很相近,其區別是: list 中的元素可以是不同的資料型別,而array和series中則只允許儲存相同的資料型別。

➢series可以更有效的使用記憶體 ,提高運算效率。

◆time- series:以時間為索引|的series。

◆dataframe :帶標籤且大小可變的二維**型資料結構,可以將dataframe理解為series的容器。

◆panel :三維的陣列,可以理解為dataframe的容器。

series

◆series是一-種類似於一維陣列的物件,它由一維陣列(各種numpy資料型別)以及一組與之相關的資料標籤(即索引)組成。

◆series建立函式:

pandas.series(data,index,dtype,copy)
◆series是一-種類似於一維陣列的物件,它由一維陣列(各種numpy資料型別)以及一組與之相關的資料標籤(即索引)組成

◆series的建立:

使用python陣列建立

使用numpy陣列建立

使用python字典建立

注意:與字典不同的是: series允許索弓|重複

◆series的字串表現形式為:索引在左邊,值在右邊

◆如果沒有為資料指定索引,則自動建立乙個0到n-1 (n為資料的長度)的整數型索引

◆可以通過series的values和index屬性獲取其陣列表示形式和索弓|物件

◆與普通numpy陣列相比,可以通過索引的方式選取series中的單個或一組值

◆series中很重要的乙個功能是:它會在算術運算中自動對齊不同索引|的資料

◆series物件本身及其索引都有乙個name屬性

◆series的索引可以通過賦值的方式就地修改

dataframe

◆dataframe是乙個**型的資料結構, 它含有一-組有序的列, 每列可以是不同的值型別(數值、字串、布林值等)

◆dataframe既有行索弓|也有列索引,它可以被看做由series組成的字典(共用同-乙個索引)

◆跟其他類似的資料結構相比(如r語言的data.frame),dataframe中面向行和面向列的操作基本上是平衡的

◆dataframe中的資料是以乙個或多個二維塊存放的(而不是列表、字典或別的一維資料結構)

dataframe特點

◆潛在的列是不同的型別

◆大小可變

◆標記軸((行和列))

◆可以對行和列執行算術運算

dataframe建構函式

pandas.dataframe( data, index, columns, dtype, copy)
◆由等長列表或numpy陣列組成的字典建立dataframe

◆dataframe結果會自動加,上索引(跟series- -樣),且全部會被有序排列

◆通過類似字典標記的方式或屬性的方式,可以將dataframe的列獲取為一 個series

◆返回的series擁有原dataframe相同的索引,且其name屬性也已經被相應地設定好了

◆列可以通過賦值的方式進行修改

◆例如,給那個空的"delt" 列賦上乙個標量值或一組值

◆將列表或陣列賦值給某個列時,其長度必須跟dataframe的長度 相匹配

◆如果賦值的是乙個series,就會精確匹配dataframe的索引,所有空位都將被填上缺失值

◆為不存 在的列賦值會建立出乙個新列

◆關鍵字de|用於刪除列

◆將巢狀字典(也就是字典的字典)傳給dataframe,它就會被解釋為:外層字典的鍵作為列,內層鍵則作為行索引

◆也可以對上述結果進行轉置

◆跟series-樣,values屬性也會以二 維ndarray的形式返回dataframe中的資料

◆如果dataframe各列的資料型別不同,則陣列的資料型別就會選用能相容所有列的資料型別

資料結構 知識點

定義 度 兒子數 分支節點 除了根和葉子的節點 根的深度為1 資料結構的分類 資料結構分為邏輯結構和物理結構。邏輯結構 表現資料之間的關係的一種資料結構,分為線性結構和非線性結構。物理結構 表現資料如何儲存的一種資料結構,通常分為順序結構 鏈式結構 索引結構和雜湊結構。有序表,也叫有序線性表,資料按...

資料結構知識點

1 線性結構與非線性結構 線性結構 線性表,棧,隊 乙個根節點,最多乙個前節點乙個後節點 首節點無前節點,尾接點無後節點 非線性結構 樹形結構,圖形結構 線性表 由一組資料元素構成,資料元素的位置只取決於自己的序號 陣列 棧 限定只能在表的一端進行插入和刪除,先進後出,只能在棧頂進出 佇列 只能在表...

資料結構,知識點

二叉樹 定義 二叉樹在圖論中是這樣定義的 二叉樹是乙個連通的無環圖,並且每乙個頂點的度不大於3。有根二叉樹還要滿足根節點的度不大於2。基本概念 二叉樹是遞迴定義的,其結點有左右之分,邏輯上二叉樹有五種基本形態 1 空二叉樹 2 只有乙個根節點的二叉樹 3 只有左子樹 4 只有右子樹 5 完全二叉樹。...