估計值的方差與總體方差之間的差異就是回歸方程對方差的解釋率。試舉一例,如圖
1,身高與體重的回歸線顯示身高與體重之間呈正相關,
mr. y
身高76
英吋體重
220磅(圖1中
的紅點),他與體重平均值的總離差(y
-y)是
220-155=65
磅。這個總離差可以被分解為兩部分:一部分是
y與回歸線之間的離差(y
-y』)
,等於30
;另一部分是**值與體重平均值的離差(y』
-y),等於
35。這兩部分之和加起來就是
65總的離差。
一般地,(y
-y』)
+(y』-
y)=(
y-y),第一部分是(y
-y』)
,這是**的誤差,有時我們也把它看成是方差的「未解釋」部分,反之,第二部分(y-
y』)則是「已解釋」部分。對
mr. y
來說,他的身高「解釋」(或**)了他的部分體重——我們預期他的體重高於平均水平,但是他甚至比他的身高所預期的體重還要重;這個額外的體重就是身高沒法解釋的,所以稱為「未解釋值」。
如果所有這乙個個的「未解釋值」被平方並加起來(y-
y』)2
,那麼我們將得到未解釋的平方和ss(
sum of square
),將這個未解釋的
ss除以
n就得到了未解釋的方差(
unexplained variance
)。同樣地,我們可以將基於所有的(y』-
y)平方而得到的已解釋的
ss除以
n來求得已解釋的方差量。已解釋和未解釋的方差加總起來等於總的方差。
如何評估回歸線究竟在以乙個變數**另乙個變數的工作中做得怎麼樣,可以將已解釋的方差除以總方差,這個比值就叫做決定係數(
coefficient of determination
),它代表了總方差被**變數所解釋或決定的比率。決定係數等於r2
(squared pearson』s correlation coeficient),r
2也稱為「方差解釋率」。
參考文獻
[1] cohen bh. explaining psychological statistics[m]. new york, us:john wiley & sons, 2008.
中譯本:
高定國等譯
, 心理統計學
(第三版
)[m]. 上海:
華東師範大學出版社
, 2011.
「解釋」的兩層含義
回歸模型中的r2
可以被稱為「方差解釋率」,那麼這個「解釋」要怎樣理解(自我描述)。
舉例,甲、乙二人同程一輛汽車,甲開車,乙坐車,這輛車以
60km/h
正常行駛在公路上。若用甲的時速解釋乙的時速,可以這樣理解:
已知甲時速
60km
,他們同乘一輛車,則可以**乙也是時速
60km
,強調他們二者之間的相關性;另一方面,已知甲時速
60km
,並且甲在開車,那麼可以確定乙也是時速
60km
,強調二者的因果關係,因為甲開車時速
60km
才導致乙的時速是
60km
,可以理解為甲驅動乙的空間位移是
60km/h。
所以,「解釋」在回歸模型中對於x和
y包含兩層含義,x驅動
y或x**
y。簡言之,「解釋」有驅動和**的兩層含義。
SAP FICO未清賬和已清賬的區別解釋
業務 未清項和已清項的概念 未清項 open item 表示財務憑證行專案的一種掛帳狀態,提示該專案需要被clearing.為什麼需要使用到未清項管理呢?記錄完整的業務交易。比如客戶a有兩筆應收款a1和a2,a1因業務糾紛,需進一步交涉,所以客戶a先針對a2付款,若沒有未清項管理,這筆收款只能按照時...
網路的FIN WAIT 2狀態解釋和分析
b 關於網路裝置的fin wait 2狀態解釋 b 出處 在http應用中,存在乙個問題,server由於某種原因關閉連線,如keepalive的超時,這樣,作為主動關閉的server一方就會進入 fin wait2狀態,但tcp ip協議棧有個問題,fin wait2狀態是沒有超時的 不象time...
PHP基礎之引用的解釋2 引用傳遞和返回
可以將乙個變數通過引用傳遞給函式,這樣該函式就可以修改其引數的值。語法如下 注意在函式呼叫時沒有引用符號 只有函式定義中有。光是函式定義就足夠使引數通過引用來正確傳遞了。在最近版本的 php 中如果把 用在 foo a 中會得到一條警告說 call time pass by reference 已經...