R2 已解釋和未解釋的方差

2021-08-10 01:47:13 字數 1907 閱讀 3276

估計值的方差與總體方差之間的差異就是回歸方程對方差的解釋率。試舉一例,如圖

1,身高與體重的回歸線顯示身高與體重之間呈正相關,

mr. y

身高76

英吋體重

220磅(圖1中

紅點),他與體重平均值的總離差(y

-y)是

220-155=65

磅。這個總離差可以被分解為兩部分:一部分是

y與回歸線之間的離差(y

-y』)

,等於30

;另一部分是**值與體重平均值的離差(y』

-y),等於

35。這兩部分之和加起來就是

65總的離差。

一般地,(y

-y』)

+(y』-

y)=(

y-y),第一部分是(y

-y』)

,這是**的誤差,有時我們也把它看成是方差的「未解釋」部分,反之,第二部分(y-

y』)則是「已解釋」部分。對

mr. y

來說,他的身高「解釋」(或**)了他的部分體重——我們預期他的體重高於平均水平,但是他甚至比他的身高所預期的體重還要重;這個額外的體重就是身高沒法解釋的,所以稱為「未解釋值」。

如果所有這乙個個的「未解釋值」被平方並加起來(y-

y』)2

,那麼我們將得到未解釋的平方和ss(

sum of square

),將這個未解釋的

ss除以

n就得到了未解釋的方差(

unexplained variance

)。同樣地,我們可以將基於所有的(y』-

y)平方而得到的已解釋的

ss除以

n來求得已解釋的方差量。已解釋和未解釋的方差加總起來等於總的方差。

如何評估回歸線究竟在以乙個變數**另乙個變數的工作中做得怎麼樣,可以將已解釋的方差除以總方差,這個比值就叫做決定係數

coefficient of determination

),它代表了總方差被**變數所解釋或決定的比率。決定係數等於r2

(squared pearson』s correlation coeficient),r

2也稱為「方差解釋率」。

參考文獻

[1] cohen bh. explaining psychological statistics[m]. new york, us:john wiley & sons, 2008.

中譯本:

高定國等譯

, 心理統計學

(第三版

)[m]. 上海:

華東師範大學出版社

, 2011.

「解釋」的兩層含義

回歸模型中的r2

可以被稱為「方差解釋率」,那麼這個「解釋」要怎樣理解(自我描述)。

舉例,甲、乙二人同程一輛汽車,甲開車,乙坐車,這輛車以

60km/h

正常行駛在公路上。若用甲的時速解釋乙的時速,可以這樣理解:

已知甲時速

60km

,他們同乘一輛車,則可以**乙也是時速

60km

,強調他們二者之間的相關性;另一方面,已知甲時速

60km

,並且甲在開車,那麼可以確定乙也是時速

60km

,強調二者的因果關係,因為甲開車時速

60km

才導致乙的時速是

60km

,可以理解為甲驅動乙的空間位移是

60km/h。

所以,「解釋」在回歸模型中對於x和

y包含兩層含義,x驅動

y或x**

y。簡言之,「解釋」有驅動和**的兩層含義。

SAP FICO未清賬和已清賬的區別解釋

業務 未清項和已清項的概念 未清項 open item 表示財務憑證行專案的一種掛帳狀態,提示該專案需要被clearing.為什麼需要使用到未清項管理呢?記錄完整的業務交易。比如客戶a有兩筆應收款a1和a2,a1因業務糾紛,需進一步交涉,所以客戶a先針對a2付款,若沒有未清項管理,這筆收款只能按照時...

網路的FIN WAIT 2狀態解釋和分析

b 關於網路裝置的fin wait 2狀態解釋 b 出處 在http應用中,存在乙個問題,server由於某種原因關閉連線,如keepalive的超時,這樣,作為主動關閉的server一方就會進入 fin wait2狀態,但tcp ip協議棧有個問題,fin wait2狀態是沒有超時的 不象time...

PHP基礎之引用的解釋2 引用傳遞和返回

可以將乙個變數通過引用傳遞給函式,這樣該函式就可以修改其引數的值。語法如下 注意在函式呼叫時沒有引用符號 只有函式定義中有。光是函式定義就足夠使引數通過引用來正確傳遞了。在最近版本的 php 中如果把 用在 foo a 中會得到一條警告說 call time pass by reference 已經...