征服統計學02 什麼是正態分佈?

2021-10-12 10:33:26 字數 1745 閱讀 7048

本文簡單介紹正態分佈

正態分佈簡介

正態分佈關鍵引數:均值&&標準差

正態分佈曲線如何繪製

正態分佈曲線現象解釋

reference

正態分佈(normal distribution),又名高斯分布(gaussian distribution),又因其曲線酷似鐘形,得名鐘形曲線

還是以上篇提到的測量身高為例,上圖正態分佈曲線x軸表示人群身高,y軸表示某個身高對應的概率;

上圖綠圈部分,極端矮小或者極端高大的身高都是少數,概率相對低,曲線矮

上圖藍圈部分,大部分人身高都處於均值身高附近,概率相對大,曲線高

不同正態分佈主要區別在曲線的寬度(標準差控制)和曲線中心位置(均值控制);

例,上圖為新生兒(左圖)和**(右圖)身高的兩個正態分佈,新生兒身高均值為20英吋,**身高均值為70英吋。

看圖說話:

正態分佈總是以均值為中心,從圖中大約可見新生兒身高主要分布在19~21英吋,**身高主要分布在60~80英吋;

新生兒正態分佈曲線比**正態分佈曲線高很多,這是因為新生兒身高落在相對高身高的概率比**更大,粗暴理解為前者只有19~21英吋可選,後者有60~80英吋相對寬的範圍可選,可選範圍越小,落在某個具體的身高上概率就越高

正態分佈曲線寬度標準差(standard deviation)決定,越大越寬,左圖為0.6,右圖為4,效果一目了然;

正態分佈曲線繪製時,使得95%的測量值落在均值±標準差的範圍內,所有左右圖紅圈分別為20±2x0.6及70±2x4所得,直接回答了正態分佈曲線寬度標準差說了算~~~;

看圖說話:

要繪製乙個標準正態分佈曲線,第乙個關鍵引數為均值,決定曲線的中心位置

第二個關鍵引數為標準差,決定曲線寬度,間接決定曲線高度,曲線越寬越矮,越窄越高。

正態分佈曲線在自然界中非常常見,如人的身高、體重、上下班時間等等,對資料統計非常有用,那是什麼導致了正態分佈的現象了,請看下篇中心極限定理(the central limit theorem).

統計學之正態分佈檢驗

本次主要是對資料集資料進行正態分佈檢驗,資料集位址為 主要包括三列資料,體溫 f 性別 1 男,2 女 心率 次 分鐘 1.資料統計 usr bin env python coding utf 8 import requests import pandas as pd import numpy as...

征服統計學06 統計模型 抽樣分布是什麼?

本文介紹統計模型和抽樣分布基本知識。統計模型描述變數之間的關係,如上圖的黑色直線就是乙個描述小鼠體格和體重關係的線型模型 模型是對真實資料的近似估計,如上圖y軸方向的虛線長表示模型估計與真實資料之間距離 我們用大量實驗資料去驗證模型是否健壯。實際生活中,常常無法直接研究總體,需要隨機抽取樣本代以研究...

在統計學中 正態分佈在統計學裡是怎樣的存在

正態分佈 normal distribution 是統計學裡最常見的分布之一。in probability theory,the normal or gaussian or gauss or laplace gauss distribution is a very common continuous...