python資料運算

2021-10-02 14:17:31 字數 4655 閱讀 9711

import pandas as pd

data =

df = pd.dataframe(data,index=

['s1'

,'s2'])

print

(df)

# 兩數相加

print

(df[

'c1'

]+ df[

'c2'])

# 兩數相減

print

(df[

'c1'

]-df[

'c2'])

# 兩數相乘

print

(df[

"c1"

]* df[

'c2'])

# 兩數相除

print

(df[

"c1"

]/ df[

'c2'])

# 任意一列加減乙個常數

print

(df[

"c1"]+

2)print

(df[

"c1"]-

2)# 任意一列乘除乙個數

print

(df[

"c1"]*

2)print

(df[

"c1"]/

2)

import pandas as pd

data =

df = pd.dataframe(data,index=

['s1'

,'s2'])

print

(df)

# 比較大小

print

(df[

'c1'

]>df[

'c2'])

print

(df[

'c1'

]!=df[

'c2'])

print

(df[

'c1'

]'c2'

])

import pandas as pd

data =

df = pd.dataframe(data,index=

['s1'

,'s2'])

print

(df)

'''彙總運算:就是將資料進行彙總返回乙個彙總以後的結果值

'''# 1。count非空值計算

# count函式:返回結果為該資料表中每列的非空值的個數

print

(df.count())

# axis = 1表示來求取每一行非空值的個數

print

(df.count(axis=1)

)# 也可以對每一列求個數

print

(df[

'c1'

].count())

# 2.sum求和函式

# sum函式:返回的是每一列的求和結果

print

(df.

sum())

# axis = 1表示每一行求和結果

print

(df.

sum(axis=1)

)# 也可以對每一列求和

print

(df[

'c1'].

sum())

# 3.mean求均值

# mean函式:返回每一列的均值

print

(df.mean())

# axis = 1表示每一行求均值

print

(df.mean(axis=1)

)# 也可以對每一列求均值

print

(df[

'c1'

].mean())

# 4。max求最大值

# max函式:可對每一行或每一列求最大值

print

(df.

max())

# axis = 1表示求每一行最大值

print

(df.

max(axis=1)

)# 也可以對每一列求最大值

print

(df[

'c1'].

max())

# 5。min求最小值

# max函式:可對每一行或每一列求最小值

print

(df.

min())

# axis = 1表示求每一行最大值

print

(df.

min(axis=1)

)# 也可以對每一列求最大值

print

(df[

'c1'].

min())

print

('...........換資料............'

)data1 =

df1 = pd.dataframe(data1,index=

['s1'

,'s2'

,'s3'])

print

(df1)

# 6。median求中位數

#median函式:可對每一行或每一列求中位數

print

(df1.median())

# axis = 1表示求每一行的中位數

print

(df1.median(axis=1)

)# 也可以對每一列求最大值

print

(df1[

'c1'

].median())

print

('...........換資料............'

)data2 =

df2 = pd.dataframe(data2,index=

['s1'

,'s2'

,'s3'])

print

(df2)

# 7.mode求眾數;眾數:每一組資料**現次數最多的數

# mode函式:可對每一行或每一列求眾數

print

(df2.mode())

# axis = 1表示求每一行的眾數

print

(df2.mode(axis=1)

)# 也可以對每一列求眾數

print

(df2[

'c1'

].mode())

#8。var求方差:方差是用來衡量一組資料的離散程度

#var函式:可對每一行或每一列求方差

print

(df1.var())

# axis = 1表示求每一行的方差

print

(df1.var(axis=1)

)# 也可以對每一列求方差

print

(df1[

'c1'

].var())

# 9。std求標準差:標準差是方差的平方根,二者都是用來表示資料的離散程度的

#std函式:可對每一行或每一列求標準差

print

(df1.std())

# axis = 1表示求每一行的標準差

print

(df1.std(axis=1)

)# 也可以對每一列求標準差

print

(df1[

'c1'

].std())

print

('...........換資料............'

)data3 =

df3 = pd.dataframe(data3,index=

['s1'

,'s2'

,'s3'

,'s4'

,'s5'])

print

(df3)

# 10。quantile求分位數:分位數是比中位數更加詳細的基於位置的指標,分位數主要有四分之一分位數,四分之二分位數,四分之三分位數,而四分之二分位數就是中位數

#std函式:可對每一行或每一列求分位數

# 求列的四分之一分位數

print

(df3.quantile(

0.25))

# 求列的四分之三分位數

print

(df3.quantile(

0.75))

# axis = 1表示求每一行的分位數

print

(df3.quantile(

0.25

,axis=1)

)# 也可以對每一列求分位數

print

(df3[

'c1'

].quantile(

0.25

))

'''

我們一般用相關係數來衡量兩者的相關程度,所以相關性計算就是計算相關係數,比較常用的是皮爾遜係數

'''import pandas as pd

data =

df = pd.dataframe(data)

print

(df)

#用corr函式計算相關性

print

(df[

'col1'

].corr(df[

'col2'])

)# 還可以對整個表中各個兩兩字段求相關性

print

(df.corr(

))

python 資料運算

算數運算 a 10b 20 print a b 相加print a b 減法print a b 乘法print b a 除法print b 2 a 求餘數print b a 冪次方print b a 取整數 結果如下 30 10 2002.0 210240000000000 2 比較運算 賦值運算 ...

python資料基本運算

1.移動到本行開頭 home鍵 2.移動到本行末尾 end鍵盤 3.注釋 ctrl 4.複製行 ctrl d 5.選擇列 滑鼠左鍵 alt 6.移動行 shift alt 上下箭頭1.單行注釋 以 號開頭。2.多行注釋 三引號開頭,三引號結尾。表示乙個功能,函式定義者是提供功能的人,函式呼叫者是使用...

python 或運算 Python運算子

python運算子 1 算術運算子 加 減 乘 除 這四個運算子是跟數學上的意義一致。取餘 兩者相除取餘數。取整 兩者相除取整數。冪 x的y次冪。a 100 b 21 c 2d 5 print a b print a b print a b print a b print a b print a b...