python 如何判斷一組資料是否符合正態分佈

正態分佈

判斷方法有畫圖/k-s檢驗

畫圖:

#匯入模組
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
#構造一組隨機資料
s = pd.dataframe(np.random.randn(
1000)+
10,columns =
['value'])
#畫散點圖和直方圖
fig = plt.figure(figsize =(10
,6))
ax1 = fig.add_subplot(2,
1,1)
# 建立子圖1
ax1.scatter(s.index, s.values)
plt.grid(
)ax2 = fig.add_subplot(2,
1,2)
# 建立子圖2
s.hist(bins=
30,alpha =
0.5,ax = ax2)
s.plot(kind =
'kde'
, secondary_y=
true
,ax = ax2)
plt.grid(
)

結果如下：

使用ks檢驗：

'''
'''#匯入scipy模組
from scipy import stats
"""kstest方法：ks檢驗，引數分別是：待檢驗的資料，檢驗方法（這裡設定成norm正態分佈），均值與標準差
結果返回兩個值：statistic → d值，pvalue → p值
p值大於0.05，為正態分佈
h0:樣本符合 
h1:樣本不符合 
如何p>0.05接受h0 ,反之 
"""u = s[
'value'
].mean(
)# 計算均值
std = s[
'value'
].std(
)# 計算標準差
stats.kstest(s[
'value'],
'norm'
,(u, std)
)

結果是kstestresult(statistic=0.01441344628501079,pvalue=0.9855029319675546)，p值大於0.05為正太分

python 如何判斷一組資料是否符合正態分佈

若隨機變數x服從有個數學期望為方差為 2 的正態分佈，記為n 其中期望值決定密度函式的位置，標準差決定分布的幅度，當 0，0 時的正態分佈是標準正態分佈判斷方法有畫圖 k s檢驗匯入模組 import numpy as np import pandas as pd import matplot...

語言的基礎是一組記號和一組規則

是用於編寫電腦程式的語言。語言的基礎是一組記號和一組規則。根據規則由記號構成的記號串的總體就是語言。在程式語言中，這些記號串就是程式。程式語言包含三個方面，即語法語義和語用。語法表示程式的結構或形式，亦即表示構成程式的各個記號之間的組合規則，但不涉及這些記號的特定含義，也不涉及使用者。語義表示程式...

特徵工程判斷一組資料的分布形態

思考輸入到nn模型中的特徵要做歸一化處理，我看到airbnb對特徵歸一化的方式因特徵而異，這點驚訝到我，我當前的工作中，對特徵歸一化處理方式是同一種。然而並不知道特徵服從什麼分布，或許選擇了乙個大家通用的歸一化方法？這個不得而知。言歸正傳，airbnb根據不同特徵做不一樣的歸一化，因為他們對資料進...

python 如何判斷一組資料是否符合正態分佈

python 如何判斷一組資料是否符合正態分佈

語言的基礎是一組記號和一組規則

特徵工程 判斷一組資料的分布形態

相關推薦

特徵工程判斷一組資料的分布形態