協方差計算相關性問題

2021-08-25 09:01:38 字數 1247 閱讀 3254

因為公司專案需求,我也跟著學習了機器學習方面的知識,狠狠補了一下數學知識。統計學是關於認識客觀現象總體數量特徵和數量關係的科學。它是通過蒐集、整理、分析統計資料,認識客觀現象數量規律性的方**科學,方差、標準差、均值都是統計學的基礎。

均值、標準差、方差都是為了通過資料計算出樣本集合的潛在資訊,我們可通過潛在資訊判斷資料的相關性。

但是均值、標準差、方差都只適用於一維資料,比如給一組體重【105,110,120,130】,便可適用於利用方差標準差來進行計算。但如果現在還有一組身高呢,比如【172,178,180,182】,想通過這兩組資料來獲得身高和體重的相關性,就無法通過方差和標準差來計算了。所以,面對這樣的資料集,就需要利用我們的協方差。

我們先來看看協方差的基本性質:

cov(x,y)便是求得體重和身高的相關性,若為整數,說明體重隨身高的增長而增長,若為負數,則體重隨身高的增長而降低 。

下面我們運用python的numpy庫來試驗一下:

import numpy
首先匯入我們的numpy庫,numpy是python語言的乙個擴充程式庫。支援高階大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數。

x=[100,90,110,120,140,130]  //定義一組體重

y=[65,60,55,50,51,45] //定義一組身高

z=[1,0,1,1,1,1] //定義一組性別

f=[s,y,z]

a=numpy.cov(f) //運用cov求得協方差矩陣

print(a)

執行之後得到以下結果,那該如何解析呢? 

我們通過cov函式求得協方差矩陣,而協方差矩陣的特性便是對角線是各個維度的方差

得出的結果便是與以上一一對應,由此我們可以得到多個weidu維度偏離其均值的程度,度量多個維度之間關係的統計量,且由此可見,協方差矩陣是乙個對稱矩陣。

numpy中的協方差,方差相關計算

協方差矩陣,求相關矩陣 假設協方差矩陣sigma import numpy as np sigma np.array 4,1,2 2,3,4 2,3,5 print sigma 4 1 2 2 3 4 2 3 5 sigma array 4,1,2 2,3,4 2,3,5 得出協方差的長度 p le...

協方差,皮爾遜相關性,卡方檢驗

1 協方差 協方差 covariance 在概率論和統計學中用於衡量兩個變數的總體誤差。而方差是協方差的一種特殊情況,即當兩個變數是相同的情況。期望值分別為 隨機變數 x 與y 之間的協方差定義為 協方差表示的是兩個變數的總體的誤差,這與只表示乙個變數誤差的方差 不同。如果兩個變數的變化趨勢一致,也...

詳解協方差與協方差矩陣計算

協方差的定義 對於一般的分布,直接代入e x 之類的就可以計算出來了,但真給你乙個具體數值的分布,要計算協方差矩陣,根據這個公式來計算,還真不容易反應過來。網上值得參考的資料也不多,這裡用乙個例子說明協方差矩陣是怎麼計算出來的吧。記住,x y 是乙個列向量,它表示了每種情況下每個樣本可能出現的數。比...