資料科學與大資料分析之專案1 假設檢驗

2021-10-13 17:38:20 字數 1101 閱讀 7693

這兩種新的學習方式能否有效地提高學生的學習成績?

在提高學生學習成績方面,兩種方法是否存在顯著差異?

在準備階段,我們先要讀取檔案:

在測試之前,我們使用shapiro.test()執行乙個分布檢查。

p值等於0.2411大於0.05,因此我們不能拒絕樣本資料正態分佈的假設,樣本資料正態分佈。

然後我們還需要在測試開始前做方差齊性檢驗。為了完成測試 bartlett.test(),我們需要先用給定的資料做乙個列表。

基於它們的標籤提取效能值,然後使用不同的向量來儲存它們。

用上面建立的向量做乙個列表,並進行bartlett檢驗,結果表明p- value等於0.8555 >> 0.05,表示不同水平的績效得分具有相同的方差。

之後我們開始檢測假設。

這兩種新的學習方式能否有效地提高學生的學習成績?

在提高學生學習成績方面,兩種方法是否存在顯著差異?

第三個假設:

零假設(h0):方法1和方法2之間沒有顯著差異。

? 1 = ? 2

備選假設(h1):方法1和方法2存在顯著差異。

? 1 ≠ ? 2

這裡我們需要檢驗這兩種方法對績效得分的影響是否相同,所以我們使用了雙邊t檢驗。

結果表明,p值等於0.04629小於0.05,雖然很接近,但我們仍然可以拒絕零假設,因為第一類錯誤的可能性小於5%,這是可以接受的。

問題1:方法1和方法2都可以有效地提高效能。

問題2:方法1和方法2有顯著差異

大資料簡介與大資料分析

大資料 是乙個體量特別大,資料類別特別大的資料集,並且這樣的資料集無法用傳統資料庫工具對其內容進行抓取 管理和處理。大資料 首先是指資料體量 volumes 大,指代大型資料集,一般在10tb?規模左右,但在實際應用中,很多企業使用者把多個資料集放在一起,已經形成了pb級的資料量 其次是指資料類別 ...

python科學計算與資料分析

主要講解numpy庫的使用,重點是其中的一些函式我們不知道或者不怎麼了解他的具體用法,朋友們可以將本文當作numpy庫的較具體的的函式說明文件進行 1.array函式 將輸入資料 列表 元組 陣列或其他序列型別 轉換為ndarray。要麼推斷出 dtype,要麼顯式指定 dtype。預設直接複製輸入...

大資料分析平台 專案2

注意的點 為什麼這麼寫?能不能加些其它的列操作?資料!什麼樣的資料!object模組下建立object main模組 建立usersession object類 思路 session的步長和時間 我從首頁進入到商品詳情到購物車 使用者到底跳轉了多少頁面就是步長 當這個資料統計之後 這個使用者在網頁中...