第一章資料的基本概念

【注】：區分測量的層次和資料的型別是十分重要的，因為對不同型別的資料將採用不同的統計方法來處理和分析。

比如對於定類資料，通常計算出各類的頻數和頻率，計算其眾數和異眾比率，進行列聯表分析和卡方檢驗；對於定序資料，可以計算其中位數和四分衛數，計算等級相關係數等非引數分析；對於定距和定比資料還可以用更多的統計方法進行處理，如計算各種統計量、進行引數估計和檢驗等。

同樣需要指出，適用於低層次測量資料的統計方法，也適用於較高層次的測量資料。定型資料為低層次資料，而定量資料為高層次資料。

先從電子**中複製自己想要的資料然後r讀取複製的資料。

> ug<-read.table("clipboard",header=true)#header=true選項用來指定第一行是標題行。 > ug id name *** region birth income height weight score 1 201205a01 趙** 女東部 1992/4/8 16.6 164 66 64.1 2 201205a02 高** 男西部 1993/5/12 20.6 162 65 71.2 3 201205a03 朱** 男中部 1995/7/18 4.1 186 87 90.2 4 201205a04 許** 女中部 1995/1/8 78.8 165 67 74.9

5 201205a05 陳** 男西部 1992/3/7 3.8 165 69 75.6

> ug<-read.table("ugdata.csv",header=true)
> ug

> ug=read_xlsx("ugdata.xlsx")
> ug

ug=read.table("**「）
ug

如：「男」，「東部」

這種資料只能取t（true)或f（false)

任何na的運算結果都是na

> i=1:9
> i
[1] 1 2 3 4 5 6 7 8 9
> i=9:1
> i
[1] 9 8 7 6 5 4 3 2 1
> seq(1,10,2)
[1] 1 3 5 7 9
> seq(0.5,9.6,length=20)
[1] 0.5000000 0.9789474 1.4578947 1.9368421 2.4157895 2.8947368 3.3736842 3.8526316
[9] 4.3315789 4.8105263 5.2894737 5.7684211 6.2473684 6.7263158 7.2052632 7.6842105
[17] 8.1631579 8.6421053 9.1210526 9.6000000

注意seq（）函式的用法

seq(from,to,by)from表示起始值，to表示序列的終止值，by表示步長。by預設為一。

資料框是一種矩陣形式的資料，但資料中各列可以是不同型別的資料。

第一章資料的基本概念

第一章程式設計基本概念

第一章 hive的基本概念

第一章 C 的基本概念

第一章 資料的基本概念

第一章 程式設計基本概念

第一章 hive的基本概念

第一章 C 的基本概念

相關推薦

第一章資料的基本概念

第一章程式設計基本概念