統計思維 程式設計師數學之概率統計(1)

2022-04-08 17:53:14 字數 843 閱讀 9092

第一章:

經驗之談:

觀察的數量太少、選擇偏差、確認偏差、不準確

更好的做法-統計方法

收集資料,使用大型全國性調查的資料

描述性統計,計算能總結資料的統計量

探索性資料分析,尋找模式、差異和其他能解決問題的而特徵

假設檢驗,評判影響是否真實

估計,樣本推斷整體

術語

經驗之談  個人隨意收集的證據

直觀效應  表示發生了某種有意思的事情的度量或匯**計量

人為    由於偏差、測量錯誤或其他錯誤導致的直觀效應

佇列    一組被調查者

橫斷面研究  收集群體在特定時間點的資料的研究

字段  資料庫中組成記錄的變數名稱

縱貫研究  跟蹤群體,隨著時間推移對同一組人反覆採集資料的研究

過取樣  為避免樣本量過少,而增加某個子群體代表的數量

總體  要研究的一組事物,通常是一群人

原始資料  未經或只經過很少的檢查 計算或解讀而採集和重編碼的值

重編碼  通過對原始資料進行計算或者其他邏輯處理得到的值

記錄  資料庫中關於乙個人或其他物件的資訊的集合

代表性  如果人群中的每個成員都有同等的機會進入樣本,那麼這個樣本就具有代表性

被調查者  參與調查的人

樣本  總體的乙個子集,用於收集資料

統計顯著  若乙個直觀效應不太可能是由隨機因素引起的,就i是統計顯著的

匯**計量  通過計算將乙個資料集歸結到乙個數字,而這個數字能表示資料的某些特點

表   資料庫中若干記錄的集合

《統計思維 程式設計師數學之概率統計》學習筆記

如果有乙個包含n個值的樣本x ix i xi 那麼它們的均值 mu 等於這些值總和除以值的數量 1 n ix i mu frac sum i n1 i xi 均值是為了描述集中趨勢,而方差則是描述分散情況。一組值的方差為 2 1n i xi 2 sigma 2 frac sum i x i mu 2...

讀書筆記 程式設計師的數學 概率統計

體會之前讀過程式設計師的數學 程式設計師的數學線性代數,這次就把程式設計師的數學 概率統計也看了。配上普林斯頓微積分讀本,算是把高數三件套都過了一遍。雖然說也上過一遍概率論,但又只剩下一些零碎的記憶了。這次看一遍這本概率統計,看看能不能撈回來一點。跟本科上課的教材相比,它的特點和之前寫過的這種數學入...

程式設計師的數學之線性代數(1)

綜述 線性代數的學習,比起計算方法,更重要的是掌握它的本質含義,這一點是非常重要的。矩陣不僅僅是數字排列而成的表而已,如果我們嘗試從空間的角度去理解矩陣,我們會發現,它的 意蘊 是非常豐富有趣的。其實,本質上來說,矩陣就是對映,在空間上的一種對映。舉個例子來闡述這個觀點 假設有乙個m n的矩陣a,在...