python計算兩組資料的P值

2022-06-17 13:06:08 字數 1158 閱讀 3316

我們在做a/b試驗評估的時候需要借助p_value,這篇文章記錄如何利用python計算兩組資料的顯著性。

一、**
# ttest.py

# -*- coding: utf-8 -*-

'''# created on 2020-05-20 20:36

# ttest.py

# @author: huiwenhua

'''## import the packages

import numpy as np

from scipy import stats

def get_p_value(arra, arrb):

a = np.array(arra)

b = np.array(arrb)

t, p = stats.ttest_ind(a,b)

return p

if __name__ == "__main__":

get_p_value([1, 2, 3, 5, ], [6, 7, 8, 9, 10])

二、t檢驗:兩樣本t檢驗

兩樣本t檢驗是比較兩個樣本所代表的兩個總體均值是否存在顯著差異。除了要求樣本來自正態分佈,還要求兩個樣本的總體方差相等也就是「方差齊性」。

檢驗原假設:樣本均值無差異(μ=μ0)

python命令stats.ttest_ind(data1,data2)

當不確定兩總體方差是否相等時,應先利用levene檢驗檢驗兩總體是否具有方差齊性stats.levene(data1,data2)如果返回結果的p值遠大於0.05,那麼我們認為兩總體具有方差齊性。如果兩總體不具有方差齊性,需要加上引數equal_val並設定為false,如下。

stats.ttest_ind(data1,data2,equal_var=false) // ttest中預設是具有方差齊性

三、結果解釋

當p值小於某個顯著性水平α(比如0.05)時,則認為樣本均值存在顯著差異,具體的分析要看所選擇的是雙邊假設還是單邊假設(又分小於和大於)注意stats.ttest_ind進行雙側檢驗。

當t值大於0,則有((1-p)* 100)%的把握認為認為第一組資料好與第二組資料。例如p=0.05,那麼我們有95%的把握認為第一組資料好於第二組資料。

兩組資料一起排序的python程式

excel裡的排序功能很強大,它能使得所有列的資料按照某一列的公升序或者降序統一實現排序。這個功能用程式設計如何實現呢?本人給出了一段用python實現這一功能的程式。本程式中,資料以列表形式儲存,將用於排序的那一組資料稱為主動排序資料,將跟隨主動排序資料而變動的資料稱為被動排序資料。程式設計的核心...

Python基礎練習(一) 兩組數的差異

解題思路 解題 給出兩組相同數量的整數,求這兩組整數的差異估算,即 對應數差值平方之和。第一組為a1,a2 an 第二組為b1,b2 bn 求 a1 b1 2 an bn 2 兩行,每行是一組整數,用空格隔開。乙個整數。1 21 2 時間限制 500ms記憶體限制 32000kb 該題用陣列結構解決...

兩組資料告訴你什麼叫 海量

第一組 如果對全球陸地進行可見光正射航空遙感成像,按照15cm pixel的解析度,那麼將得到約22pb的資料。第二組 如果對全球陸地進行15cm pixel解析度的可見光正射航空遙感成像,對街景按照2cm pixel解析度進行可見光遙感成像,對建築物室內進行0.5cm pixel解析度可見光遙感成...