Pandas資料的相關性分析

2021-10-03 11:28:46 字數 675 閱讀 9537

本文的主要內容是基於中國大學mooc(慕課)中的「python資料分析與視覺化」課程進行整理和總結。

兩個事物,表示成x和y,如何判斷他們之間的相關性?

x增大,y也增大,兩個變數正相關;

x增大,y減小,兩個變數負相關;

x增大,y沒有明顯變化,兩個變數不相關;

度量兩個資料的相關性有以下方法: 方法

說明.cov()

計算協方差矩陣

.corr()

計算相關係數矩陣,pearson,spearman,kendall等係數

hprie = pd.series([3

,22,12

,22,12

],index=

['2008'

,'2009'

,'2010'

,'2011'

,'2012'])

m2 = pd.series([8

,15,10

,23,10

],index=

['2008'

,'2009'

,'2010'

,'2011'

,'2012'

])

hprie.corr(m2)

0.8384822301002933

spearman相關性分析 相關性分析

r語言常用函式 cor 預設結果為矩陣 cor mydat,use method use 缺失值的處理,method 處理方法 cor x,y 可以計算非方形矩陣,x y分別為2個矩陣,相同的行數 cor.test x,y,alternative method x y為檢驗相關性的變數 librar...

資料相關性分析

源於 python資料分析與挖掘實戰 coding utf 8 import pandas as pd catering sale data catering sale all.xls data pd.read excel catering sale,index col u 日期 data.corr...

相關性分析

1.圖表 折線圖 散點圖2.協方差及協方差矩陣協方差 用來衡量兩個變數的總體誤差。只能對兩組資料進行分析 3.相關係數 correlation coefficience 可以對相關的密切程度進行度量弊端 因為沒有模型,所以無法進行 正態性檢驗 t檢驗 假設檢驗 異常值檢驗 箱線圖法 q1 位於25 ...