《深入淺出統計學》讀書筆記

2021-09-27 08:39:03 字數 1960 閱讀 4347

前言

大腦對於影象的理解效率,遠遠大於對文字的理解效率

**結合比單純的影象或者文字更容易被人理解與接受

統計是對大量資訊的簡化,化繁為簡

統計的結果應以影象的方式表達出來,因為影象跟容易被人接受

統計的目的是為了獲得某個結論,進而為決策服務

數、資料、資訊、知識、智慧型

1、數,1/2/3/4/5…..n,單純的數字

2、資料,1萬元、2萬元、3萬元,資料(數字的依賴),是指帶單位的數字,單位讓數字變得有意義

3、資訊,對事物的客觀描述稱為資訊,如小張2023年月收入1萬元

4、知識,資訊中蘊含的規律叫知識,如蘋果掉下來是資訊、水流下來是資訊、石頭掉下來是資訊,這些資訊蘊含的共同規律是萬有引力定律,這是知識

5、智慧型,智慧型是對知識的靈活運用,可以根據各種實際情況結合掌握的知識做出合理的決策。比如我們可以根據萬有引力定律來計算出不同高度的衛星需要保持什麼樣的速度才能保證軌道

常用圖形

餅圖,用來反映各項的佔比情況

條形圖(柱狀圖),用來對比各項的數值

折線圖,用來反映趨勢的走勢

平均數包含均值、中位數、眾數,平均數的意義是尋找乙個【典型值】

均值,為所有值相加再除以所有值的個數

極值,與均值差異巨大的值稱為極值,也叫異常值

資料偏斜,極值有可能導致均值嚴重偏離資料應反映的實際情況,如果發生此種情況,我們稱為資料偏斜

中位數,將所有數排序後,位於中間位置的值

眾數,所有數裡面重複次數最高的數

資料的距

全距,最大值減去最小值的差,反映了資料的分布情況

平均距離,異常值將導致全距的意義失效,解決此問題,我們引入了平均距離的概念,即各個值到均值的平均距離

方差,為了解決平均距離公式裡產生的負數導致資料抵消問題,我們在計算距離時對各個距離先平方再計算,所以叫方差

標準差,方差對實際資料進行了放大,為了獲得更直觀的平均距離,我們對方差進行開根,得到的結果叫標準差,它具有重要的參考價值

標準分如果兩個百公尺跑運動員a/b,集訓前的成績為a均值13秒,標準差2秒;b均值12秒,標準差1秒;集訓後a均值10秒;b均值10秒;請問到底a的進步大還是b的進步大

成績一樣,難以比較,所以引入了標準分。標準分就是原始分與平均分的差,除以標準差的商。用公式表示為:z=(x-μ)/σ。其中x為某一具體分數,其中μ為平均數,σ為標準差。

那麼a=(10-13)/2=-1.5,b=(10-12)/1=-2,意思是a的成績在其平均速度前方1.5個標準差的位置,而b的成績在其平均速度前方2個標準差的位置,為負數表明成績都比平均成績快,但是-2明顯比-1.5更快,所以b的進步速度是大於a的

標準分的應用

判斷某學生的成績在全班成績中所處的位置

判斷同一科目在不同次的考試中,成績的公升降程度

用標準分對不同學科的教學質量可以進行比較

能夠準確地選拔優秀學生

置信區間

我們使用均值的目的是尋找乙個典型值,以判斷資料是否正常,很明顯我們判斷資料是否正常的依據是資料是否在典型值附近,在附近則認為正常,否則認為不正常

所以,實際上我們是基於典型值設定了乙個區間來判斷數是否正常,而這個區間我們有科學的計算方式,計算出來的區間就叫,置信區間

如果樣本值在置信區間內,我們稱為可信值,否則稱為不可信值

置信水平,置信區間包含的總體統計量,比如置信水平90%,意思是置信區間包含了90%樣本資料,另外10%在置信區間外

置信區間=均值±誤差範圍

誤差範圍=c*標準差,置信水平 :c值(90% :1.64;95% :1.96;99% :2.58)

統計與抽樣

第一步,設定總體目標

抽樣方法

隨機抽樣,隨機抽取樣本

分層抽樣,先對總體進行分組,再在各個組內進行隨機抽樣

樣本情況

無偏樣本,無偏樣本可以代表目標總體

偏移樣本,偏移樣本無法代表目標總體,無法根據樣本對總體做出判斷

樣本均值被稱為總體均值的點估計量

深入淺出統計學讀書筆記 離散概率分布的應用

概率可以得知發生某件事情的可能性大小,但無法指出整體影響,比如賺到的錢真的填的平那些虧掉的錢嗎 概率分布如下表 組合無 檸檬櫻桃 美元 櫻桃美元x 14914 19p x x 0.977 0.008 0.008 0.006 0.001 期望e x 0.77 指出每一局賭局能夠期望得到的平均收益 方差...

深入淺出pmp讀書筆記(三)

深入淺出 pmp 讀書筆記 程序結構 pmp將專案劃分成為一系列程序的集合,程序直接的銜接,就十分重要了。而程序的結構已經專案的知識面就是程序銜接流暢的關鍵。1.程序的結構 pmp為所有的程序都設定了相同的結構,每個程序都由輸入,工具和技術以及輸出三部分組成。a.輸入 程序工作所需要的資訊,資料,檔...

《深入淺出struts》讀書筆記 3

第十八章 大規模的分頁與排序。本章介紹了 display 標籤庫,要使用 display 標籤庫,需要新增 commons beanutils.jar commans collection.jar commons logging.jar commons lang.jar 此外還需要 jstl.jar...