概率統計 商務與經濟統計知識點總結 Part 3

2021-10-05 00:02:13 字數 1726 閱讀 5390

4月半啦!感覺一步一步的學習比較的踏實,希望好事兒會一件一件來的。別灰心!!還有就是晚上早點睡。

這一章節呢,對應第五章的離散型概率分布,並且其中包含最最重要的概率分布正態分佈,很多問題都是建立在這個正態性假設上的。

對於連續型變數來說,最重要的概念是概率密度函式。下面就列除幾個最重要的分布。

均勻概率分布

處理連續型隨機變數和離散型隨機變數時,主要存在以下兩方面的區別:

我們不再討論隨機變數取某一特定值的概率,我們討論隨機變數在某一給定區間上取值的概率。

連續型隨機變數在某個給定區間上取值的概率,被定義為在區間上概率密度函式曲線下的面積。這意味著連續型隨機變數取某個特定值的概率為零。

數學期望和方差的公式如下:

正態概率分布

正態分佈有廣泛的實際應用,比如人的身高和體重、考試成績、科學測量、降雨量以及其他類似的數值,都近似服從正態概率分布。

我們觀察到,正態分佈有以下特徵:

正態分佈族中的每個分布因均值miu和標準差sigma這兩個引數的不同而不同

正態曲線的最高點在均值處達到,均值還是分布的中位數和眾數

分布的均值可以是任意數值:負數、零或正數

正態分佈是對稱的

標準差決定曲線的寬度和平坦程度。標準差越大則曲線越寬、越平坦,表明資料有更大的變異性

正態隨機變數的概率由正態曲線下的面積給出

下面是隨機變數在一些常用區間內取值的百分比

與之相關的有乙個標準正態概率分布,不同之處就在於引數的取值上面。

所有的正態分佈的概率計算都可以轉化成標準正態隨機變數,如:

二項概率的正態近似

一般計算二項分布是比較麻煩的,所以我們給定一些條件,在這些條件下可以將二項分布近似為正態分佈。

近似條件:np≥

5,n(

1−p)

≥5np\geq 5 , n(1-p)\geq 5

np≥5,n

(1−p

)≥5對於二項分布的正態近似要注意,離散型變數近似為連續型,要注意校正。

指數概率分布

可用於描述諸如到達某洗車處的兩輛車的時間間隔,裝載一輛卡車所需時間,高速公路上兩起重大事故發生地之間的距離等隨機變數。

泊松分布與指數分布的關係

泊松分布描述了每一區間中事件發生的次數,指數分布描述了事件發生的時間間隔長度。

今天時間關係就只寫一章啦!

《商務與經濟統計》Python實現筆記(一)

import pandas as pd import numpy as np from scipy import stats 傳資料 data pd.read excel r c users liuhao desktop python work python資料分析與挖掘實戰 chapter8 te...

《商務與經濟統計》學習筆記(三)

有時候資料集中會包含乙個或多個異常大或小的觀測值,這些極端值稱為異常值。標準化數值 z 分數 可以用來確認異常值。什麼是 z 分數 利用平均數和標準差,我們可以確定任何觀察值的相對位置。任何觀測值的z 分數都被認為是對資料集中觀測值相對位置的量度。計算公式為 z i xi x s.z x bar x...

統計學 論統計學知識點

二 資料度量標準 三 概率分布 四 統計假設檢驗 五 相關和回歸 總結說明 統計學在資料分析的基礎上,研究如何測定,收集,整理,歸納和分析資料規律,以便給出正確訊息的學科。它在資料探勘,自然語言處理,機器學習中都被廣泛使用,比如博主之前的那篇關於規則與統計相結合的詞義消岐方法研究學習筆記,其中作者就...