pandas 學習彙總17 計算 tcy

2021-09-02 23:08:49 字數 2519 閱讀 9595

1.算數計算  2018/11/8      2018/12/10
1.1函式:
series.product([axis, skipna, level, …]) # 返回請求軸的值的乘積;各個元素相乘

series.dot(other) # 矩陣乘法與dataframe或內部產品與series物件。

1.2算數計算例項:
# s1,s2同為序列或資料幀;可以不等長,之一可為標量,可含np.nan值;都必須為數字

# add +;sub -; mul* ;div / ;//(整除) ;s2.mod(s1)模除(返回餘數);** ;都有自身運算

df1=pd.dataframe(np.arange(4).reshape(2,2),columns=list('ab'),index=['one','two'])

df2=pd.dataframe(np.arange(10,19).reshape(3,3),columns=list('abc'),index=['one','two','three'])

df1.add(df2)#等價df1+df2

# a b c

# one 10.0 12.0 nan

# three nan nan nan

# two 15.0 17.0 nan

df1.add(df2,fill_value=0)

# a b c

# one 10.0 12.0 12.0(新增)

# three 16.0 17.0 18.0 <---新增一行

# two 15.0 17.0 15.0(新增)

s = s1 + s2

s1 += s2 # s1=s1+s2

s1.round() #四捨五入引數為整數,當為1時將第二位小時捨入到第一位

2.比較運算子
# 運算子:>,>=,<,<=,!=,== ;eq,ne,lt,gt, le,ge

df.gt(df2);s1>s2

# one two three

# a false false false

# b false false false

# c false false false

# d false false false

3.1布林運算:
df1 = pd.dataframe(, dtype=bool)

df2 = pd.dataframe(, dtype=bool)

df1 & df2#邏輯與

df1 | df2#邏輯或

df1 ^ df2#異或

-df1 #取反

# a b

# 0 false true

# 1 true false

# 2 false false

3.2.if / truth語句:

# 用a.empty, a.any() or a.all();不用and,or,not錯誤用法:

# if pd.series([false, true, false]):#值錯誤

if pd.series([false, true, false]) is not none:pass

#檢查是否有任何值true:

if pd.series([false, true, false]).any():pass

(df > 0).any()

(df > 0).any().any()#true

df.empty #false

(df > 0).all()

# one false

# two false

# three false

# dtype: bool

# 評估單元素物件用bool():

pd.series([true]).bool() #true

pd.dataframe([[false]]).bool()#false

3.3.使用in運算子
# in運算子測試索引中的成員資格

s = pd.series(range(5), index=list('abcde'))

'b' in s # true

'a' in df1# true

# 測試值的成員資格用isin():

s.isin([2])

# a false

# b false

# c true

# d false

# e false

# dtype: bool

s.isin([2]).any() #true

df1.isin([1]).any().all()#true

pandas彙總和計算描述統計

pandas 物件擁有一組常用的數學和統計方法。他們大部分都屬於簡約和匯 計,用於從series中提取單個值 如sum或mean 或從dataframe的行或列中提取乙個series。跟對應的numpy陣列方法對比,他們都是基於沒有缺失資料的假設而構建的。看例子 呼叫dataframe的sum方法將...

pandas入門 彙總和計算描述統計

from pandas import dataframe,series import numpy as np df dataframe 1.4,np.nan 7.1,4.5 np.nan,np.nan 0.75,1.3 index a b c d columns one two print df o...

Pandas 基礎 (4) 彙總和計算描述統計

pandas 物件擁有一組常用的數學和統計方法,他們大部分都屬於約簡和匯 計,用於從 series 中提取單個值 如 sum mean 或者從 dataframe 的行或列中提取乙個 series。in 144 df dataframe 1,np.nan 2,3 np.nan,np.nan 0,2 ...