Pandas統計分析基礎之DataFrame

2021-10-05 14:22:37 字數 2139 閱讀 7547

3、更改dataframe中的資料

4、增加dataframe中的資料

刪除dataframe中的資料

dataframe類似於資料庫的表或者excel的**,panda將資料讀取之後,以dataframe的資料結構儲存在記憶體中。

下面就來介紹一下dataframe的增刪查改操作。

因為dataframe是乙個帶有標籤的二維陣列,每乙個標籤相當於每一列的列名。因此,可以以字典訪問某乙個key值得方式使用對應的列名,實現單列資料的訪問。

order_id = detail[

'order_id'

]#order_id就是乙個series型別,本質上和乙個一維陣列一樣,有類似的訪問形式

type

(order_id)

對單列多行資料的訪問

dishes_name5 = detail[

'dishes_name'][

:5] a=np.array(disher_name5,dtype=

'u8'

)# 去除了索引

對多行多列資料的訪問

orderdish = detail[

['order_id'

,'dishes_name']]

[:5]

多列多行資料的訪問:

orderdish = detail[:5

][:5

]#訪問前五列前五行的函式

dishes_name1 = datail.loc[:,

'dishes_name'

]dishee_name2 = datil.iloc[:,

3]

orderdish1 = detail.loc[:,

['order_id'

,'dishes_name']]

orderdish2 = detail.iloc[:,

[1,3

]]

detail.loc[2:

6,['order_id'

,'dishes_name']]

detail.iloc[2:

7,[1

,3]]

# 將order_id為458的,變換成45800

detail.loc[detail[

'order_id']==

'458'

,'order_id']=

'45800'

# 兩個列進行相乘之後賦值給新的列

detail[

'payment'

]= detail[

'counts'

]*detail[

'amounts'

]# 直接賦值為常量,則該列都是相同的值

detail[

'pay_way']=

'現金支付'

drop(labels,axis=

0,level=

none

,inplace=

false

,error=

'raise'

)# labels:接收string或array

# axis:代表操作軸向,0或1

# levels: 接收int或者索引名,代表標籤所在級別

# inplace: 接收boolean,代表操作是否對原資料生效

例:

detail.drop[lebels =

'pay_way'

,axis =

1,inplace =

true

]# 將pay_way這一列刪除掉,對原資料生效

pandas統計分析基礎(2)

pandas描述性統計方法的常見方法 方法統計含義 方法統計含義 min最小值 max最大值 mean 均值count 非空數目 median 中位數mode 眾數std 標準差var 方差cov 協方差ptp 極差skew 樣本偏度 kurt 樣本峰度 sem標準誤差 quantile 四分位數 ...

pandas的統計分析

import pandas as pd import numpy as np data pd.read excel meal order detail.xlsx print data n data print data 的列索引 n data.columns print data 的資料型別 n d...

4 pandas統計分析基礎 下

4.4.2 使用agg方法聚合資料 4.4.4 使用transform方法聚合資料 4.5 建立透視表與交叉表 4.5.2 使用crosstab函式建立交叉表 該方法提供的是分組聚合步驟中的拆分功能,能根據索引或字段對資料進行分組。其常用引數與使用格式如下。用groupby方法分組後的結果並不能直接...