資料預處理之資料相關性分析

2021-09-28 15:48:26 字數 528 閱讀 5292

分析連續變數之間線性相關程度的強弱,並用適當的統計指標表示出來的過程成為相關分析

1.person 相關係數:

要求連續變數的取值服從正態分佈,一般用於分析連續性變數之間的關係

一般用於分析不服從正態分佈的變數、分類或等級變數之間的關聯性

3.判定係數:

用來衡量回歸方程對 y 的解釋程度

#-*- coding: utf-8 -*-

import pandas as pd

catering_sale="catering_sale.xls"

data=pd.read_excel(catering_sale,index_col=u'日期') #讀取資料,指定日期列為索引列

data.corr() #相關係數矩陣,即給出了兩個物品之間的相關係數

data.corr()[u'a物品'] #只顯示a物品與其他菜式的相關係數

data[u'a物品'].corr(data[u'b物品']) #計算a物品與b物品的相關係數

資料相關性分析

源於 python資料分析與挖掘實戰 coding utf 8 import pandas as pd catering sale data catering sale all.xls data pd.read excel catering sale,index col u 日期 data.corr...

Python 資料相關性分析

python方差協方差相關係數離散度pandasnumpy 接下來,我們將使用 anaconda 的 ipython 來演示如何使用 python 資料相關性分析,我所使用的 python 版本為 3.6.2 首先,我們將會建立兩個陣列,陣列內含有 20 個資料,均為 0,100 區間內隨機生成。a...

spearman相關性分析 相關性分析

r語言常用函式 cor 預設結果為矩陣 cor mydat,use method use 缺失值的處理,method 處理方法 cor x,y 可以計算非方形矩陣,x y分別為2個矩陣,相同的行數 cor.test x,y,alternative method x y為檢驗相關性的變數 librar...