R語言大體概括。

2021-08-03 08:10:03 字數 981 閱讀 2186

一.資料分析所具備的知識和技能?

1.計算機基礎  2.數學和統計知識  3.業務相關的

二.資料科學家的分類

1.資料開發  2.資料檢測分析    3.資料探勘  4.資料商人

三.完整的資料分析流程

1.定義研究問題,定義理性的資料集,確定能夠獲取什麼資料,獲取資料,清理資料

2.探索性分析(資料視覺化),統計分析、建模(機器學習)等

3.解釋/交流的結果(資料視覺化),挑戰結果(有沒有其他的可能?)

書寫報告(reproduccible原則)

假設驅動:是對於事實來假設

資料驅動:提出一寫假設,再去分析

四.資料基礎

觀測 :例如是mysql裡的一條資料,也就是具體的數。     

變數 :例如是mysql裡的乙個字段   

變數的型別可分為:數值(連續,離散)可以進行加減乘除,求平均等運算    和    分類(無序,有序)取值空間有限,不能進行運算兩種

變數之間的關係(對應不同的視覺化方法和統計分析方法)

兩個數值之間

........

........

數值變數

資料集中趨勢的測量(均數,中位數,眾數)

均值:是指平均數

中位數:是指排序後正中間的乙個數,如果是偶數的話就是兩個中間數的平均值

眾數:出現次數最多的數

資料的分散趨勢的測試(值域,方差,標準差,四方位距)

資料矩陣:整塊的資料

資料視覺化:

乙個數值的變數:柱狀圖,點圖,箱圖

另個熟知的變數:散點圖

分類變數

乙個分類變數:頻率表,條形表

兩個分類變數:關聯表,相對頻率表,分段條形表,相對頻率分段條形表,馬賽克表

乙個分類變數,乙個數值變數:併排箱圖

r語言electricity資料集 R語言 資料集

第二章 建立資料集 1.r語言的資料型別 數值型 字元型 邏輯型 複數型 虛數 和原生型 位元組 2.資料結構 a.向量 儲存數值型 字元型和邏輯型資料的一維陣列 a c 1,2,3,4,5 建立 組合功能的函式c a 1 1 2 3 4 5 a c 1,4 訪問 方括號 向量中指定的元素 1 1 ...

r語言mfrow全程 R語言程式

相信很多都對前面我說的r語言感興趣吧,分享一下我的資料吧。這是關於驗證中心極限定理的r程式!驗證 無論隨機變數原來服從哪種分布,只要樣本容量足夠大,其均數都會服從正態分佈 1.正態分佈 ax axwindows 1280,720 par mfrow c 2,2 plot density a a ma...

R語言 理解R效能

通過了解限制r計算效能的因素,從而更好的利用起r的效能,影響r的因素 cpu,ram,磁碟i o,演算法。所以,當資料量小時,計算複雜度高,會受到cpu影響。資料量大時,會受到磁碟i o還有ram的影響。r是解釋型語句,即每次執行r程式的時候,r 需要重新解釋翻譯成機器 即使 不變。因為每次執行時,...