統計 相關性與自相關性

2022-07-21 20:18:22 字數 1155 閱讀 3916

相關係數度量指的是兩個不同事件彼此之間的相互影響程度;而自相關係數度量的是同一事件在兩個不同時期之間的相關程度,形象的講就是度量自己過去的行為對自己現在的影響。

自相關,也稱 序列相關。是乙個訊號於其自身在不同時間點的互相關。非正式地來說,它就是兩次觀察之間的相似度對它們之間的時間差的函式。它是找出重複模式(如被雜訊掩蓋的週期訊號),或識別隱含在訊號諧波頻率中消失的基頻的數學工具。它常用於訊號處理中,用來分析函式或一系列值,如時域訊號。

皮爾森相關:

由於在自相關時,x的期望和方差不隨著時間的變化而改變。則自相關函式可以表示為時間延遲

的函式,如下:

,自相關函式是表達訊號和它的多徑訊號的相似程度。乙個訊號經過類似於反射、折射等其它情況的延時後的副本訊號與原訊號的相似程度。

主要性質如下:

(1)自相關函式為偶函式,其圖形對稱於縱軸。

(2)當s=t 時,自相關函式具有最大值,且等於訊號的均方值,即

(3)週期訊號的自相關函式仍為同頻率的週期訊號。

意義:兩個相關函式都是對相關性,即相似性的度量。如果進行歸一化,會看的更清楚。

自相關就是函式和函式本身的相關性,當函式中有週期性分量的時候,自相關函式的極大值能夠很好的體現這種週期性。互相關就是兩個函式之間的相似性,當兩個函式都具有相同週期分量的時候,它的極大值同樣能體現這種週期性的分量。

r語言計算相關係數,首先需要載入cor()函式包,它可以計算三種不同的相關係數如pearson相關係數、spearman相關係數、kendall相關係數。而pcor()函式包則是計算偏相關係數。

acf(c2)     #自相關圖

> pacf(c2)   #偏自相關圖

參考:偏相關分析是指當兩個變數同時與第三個變數相關時,將第三個變數的影響剔除,只分析另外兩個變數之間相關程度的過程,判定指標是相關係數的r值。

偏相關分析的主要作用在於,在所有的自變數中,判斷哪些自變數對因變數的影響較大,從而選擇作為必需的自變數,至於那些對因變數影響較小的自變數就可以捨去而不予考慮。這樣,在計算多元回歸方程時,只要保留起主要作用的自變數,用較少的自變數描述因變數的平均變動量。 

某乙個要素對另乙個要素的影響或相關程度時,把其他要素的影響視為常數,即暫不考慮其他要素的影響,而單獨研究那兩個要素之間的 相互關係的密切程度時,稱為偏相關。

在排除了其他變數的影響情況下再計算兩變數的(簡單)相關係數

spearman相關性分析 相關性分析

r語言常用函式 cor 預設結果為矩陣 cor mydat,use method use 缺失值的處理,method 處理方法 cor x,y 可以計算非方形矩陣,x y分別為2個矩陣,相同的行數 cor.test x,y,alternative method x y為檢驗相關性的變數 librar...

基因相關性

描述 為了獲知基因序列在功能和結構上的相似性,經常需要將幾條不同序列的dna進行比對,以判斷該比對的dna是否具有相關性。現比對兩條長度相同的dna序列。首先定義兩條dna序列相同位置的鹼基為乙個鹼基對,如果乙個鹼基對中的兩個鹼基相同的話,則稱為相同鹼基對。接著計算相同鹼基對佔總鹼基對數量的比例,如...

基因相關性

為了獲知基因序列在功能和結構上的相似性,經常需要將幾條不同序列的dna進行比對,以判斷該比對的dna是否具有相關性。現比對兩條長度相同的dna序列。首先定義兩條dna序列相同位置的鹼基為乙個鹼基對,如果乙個鹼基對中的兩個鹼基相同的話,則稱為相同鹼基對。接著計算相同鹼基對佔總鹼基對數量的比例,如果該比...