機器學習基礎 math（10） P值

乙個統計指標，許多科學領域中的研究結果的意義均是由p值來判斷的。它們被用來證明或駁回乙個「零假設」：通常假定所測試的效果並不存在。

當p值越小，該實驗結果是由純粹的偶然所造成的可能性就越小。

由於樣本採集的有限性，他通常只能以小樣本數來進行統計平均，不過在這研究的過程中，他發現小樣本統計平均結果不滿足他一開始認為的高斯分布。為了明白平均數精度與樣本數的關係，gosset嘗試著去計算不同樣本尺寸下的平均數精度，而這一問題也正是**的研究核心。

他計算得到的結果包含在了他的t-table分布表中，而現在一般只要是接觸過統計課程的人都會知道t分布，即用來描述不同樣本數對於統計概率的影響，當樣本數足夠大的時候，就等同於標準正態分佈(高斯分布)。

fisher帶著一些武斷性的選擇α=0.05的概率值來衡量是否具有統計顯著性，當 p值（統計學術語，原假設成立時得到與樣本相同或者更極端結果的概率，p值越小，拒絕原假設的理由越充分，表明結果越顯著）小於0.05時，我們拒絕原假設。

比如，一位研究人員想要確定一種新的教學方法是否有效，他可以選取一組新教學方案教學的學生和普通教學方案的學生的學習成績做對比。如果接受新方法的學生的分數比那些沒有接受新方法的學生的分數高出5%的機率（p值），那麼fisher就認為新教學方案是有效的。不過後來證明fisher武斷的選擇α=0.05的概率值來衡量是否具有統計意義的邏輯是有缺陷的。

乙個多世紀後，許多研究者認為fisher選擇α=0.05誘發了乙個科學上的危機。諸如心理學、經濟學和醫學等學科上的實驗結果，如果使用α=0.05作為判定閾值的話，那麼將導致實驗結論錯誤。

使用α=0.005來作為新的閾值。

enjamin說:「雖然這樣直接使用α=0.005解決方案並不完美，但已經可以在短期內做很多事。」正如提案的研究所表明的，使用α=0.005解決方案可以減少一半的經濟學和心理學實驗上的錯誤結果。

benjamin承認選擇α=0.005也帶有一點武斷性質，併同他的同事也討論過其他更低的閾值，但是他認為α=0.005是符合邏輯的。benjamin補充到，對於0.05閾值的共同解釋——結果（原假設）有95%的可能性是正確的，但使用更先進的統計技術發現，這95%的機率實際上是更接近於p值等於0.005。

閾值從0.05更改到0.005只能挽救醫學，心理學和經濟學領域部分的研究結果，benjamin的團隊更希望醫學研究人員、經濟學家和心理學家能去正視現今他們領域中出現的科研誠信危機。

機器學習基礎 math（10） P值

機器學習基礎 math（5）矩陣

機器學習基礎 math（16）各種乘積

機器學習基礎 math（17）各種距離

機器學習基礎 math（10） P值

機器學習基礎 math（5） 矩陣

機器學習基礎 math（16） 各種乘積

機器學習基礎 math（17） 各種距離

相關推薦

機器學習基礎 math（5）矩陣

機器學習基礎 math（16）各種乘積

機器學習基礎 math（17）各種距離