python筆記29 資料分析之相關分析

2021-09-10 19:02:49 字數 809 閱讀 2975

# -*- coding: utf-8 -*-

#1. 概念:相關分析(correlation analysis),是研究兩個或兩個以上隨機變數之間相互依存關係的方向和密切程度的方法。

#相關分析分為:

#線性相關

#非線性相關

#這裡我們主要介紹常用的線性相關,線性相關也稱為直線相關,也就是當乙個連續變數發生變動時,另乙個連續變數相應的成線性關係變動。

#相關分析函式:

#dataframe.corr()

#series.corr(other)

#函式說明:

#如果由資料框呼叫corr方法,那麼將會計算每個列兩兩之間的相關度

#如果由序列呼叫corr方法,那麼只是計算該序列與傳入的序列之間的相關度

import pandas

data = pandas.read_csv("d:/workspaces/python/pythonstudy/29.csv")

#先來看看如何進行兩個列之間的相關度的計算

data['人口'].corr(data['文盲率']) #0.10762237339473261 看來是低度相關

#多列之間的相關度的計算方法:

#選擇多列的方法:

data[[

'超市購物率','網上購物率','文盲率','人口'

]]#資料框呼叫corr,計算兩兩之間的相關度:      

data[[

'超市購物率','網上購物率','文盲率','人口'

]].corr() 

#可以看到,文盲率與超市購物率為正中度相關,與網上購物率為負中度相關

Python資料分析筆記

數值型字元型 資料結構 取值 true 真 false 假 運算規則 與 一假為假,兩真為真 true true true false false false 或 兩假為假,一真為真 true true true false false falsenot 非 非真為假,非假為真 not true n...

python筆記31 資料分析之矩陣分析

coding utf 8 1.概念 矩陣分析,是指根據事物 如產品,服務等 的兩個重要屬性 指標 作為分析的依據,進行關聯分析,找出解決 問題的一種分析方法。矩陣分析法在解決問題和資源分配時,為決策者提供重要的參考依據,先解決主要矛盾,再解決次要矛盾,有利於提高工作效率,有 利於決策者進行資源的優化...

Python資料分析筆記(二)

接上文python資料分析筆記 一 關注一些每行資料的 a 字段 發現這行含有url短操作的瀏覽器,裝置,應用程式的相關資訊 我們現在想要按微軟使用者和非微軟使用者對時區資訊進行分解,即想知道不同時區微軟使用者和非微軟使用者的比例 假定 a 欄位中含有 windows 的就認為是微軟使用者 首先,去...