第一章 資料的基本概念

2021-09-28 19:49:13 字數 1636 閱讀 9446

【注】:區分測量的層次和資料的型別是十分重要的,因為對不同型別的資料將採用不同的統計方法來處理和分析。

比如對於定類資料,通常計算出各類的頻數和頻率,計算其眾數和異眾比率,進行列聯表分析和卡方檢驗;對於定序資料,可以計算其中位數和四分衛數,計算等級相關係數等非引數分析;對於定距和定比資料還可以用更多的統計方法進行處理,如計算各種統計量、進行引數估計和檢驗等。

同樣需要指出,適用於低層次測量資料的統計方法,也適用於較高層次的測量資料。定型資料為低層次資料,而定量資料為高層次資料。

先從電子**中複製自己想要的資料然後r讀取複製的資料。

> ug<-read.table("clipboard",header=true)#header=true選項用來指定第一行是標題行。

> ug

id name *** region birth income height weight score

1 201205a01 趙** 女 東部 1992/4/8 16.6 164 66 64.1

2 201205a02 高** 男 西部 1993/5/12 20.6 162 65 71.2

3 201205a03 朱** 男 中部 1995/7/18 4.1 186 87 90.2

4 201205a04 許** 女 中部 1995/1/8 78.8 165 67 74.9

5 201205a05 陳** 男 西部 1992/3/7 3.8 165 69 75.6

> ug<-read.table("ugdata.csv",header=true)

> ug

> ug=read_xlsx("ugdata.xlsx")

> ug

ug=read.table("**「)

ug

如:「男」,「東部」

這種資料只能取t(true)或f(false)

任何na的運算結果都是na

> i=1:9

> i

[1] 1 2 3 4 5 6 7 8 9

> i=9:1

> i

[1] 9 8 7 6 5 4 3 2 1

> seq(1,10,2)

[1] 1 3 5 7 9

> seq(0.5,9.6,length=20)

[1] 0.5000000 0.9789474 1.4578947 1.9368421 2.4157895 2.8947368 3.3736842 3.8526316

[9] 4.3315789 4.8105263 5.2894737 5.7684211 6.2473684 6.7263158 7.2052632 7.6842105

[17] 8.1631579 8.6421053 9.1210526 9.6000000

注意seq()函式的用法

seq(from,to,by)from表示起始值,to表示序列的終止值,by表示步長。by預設為一。
資料框是一種矩陣形式的資料,但資料中各列可以是不同型別的資料。

第一章 程式設計基本概念

1 計算機是一種具有內部儲存能力,由程式自動控制的電子裝置。2 當給出命令之後,計算機按指令順序自動進行操作,把這種可以連續執行的一條指令的集合稱為 程式 3 計算機只能接受和處理由0和1的 構成的二進位制指令或資料。把由高階語言編寫的程式稱為 源程式 把有二進位制 表示的程式稱為 目標程式 c源程...

第一章 hive的基本概念

1 hive基本概念 hive是乙個以apache hadoop為基礎的資料倉儲基礎設施。hive的設計目標是使得資料彙總更加簡單和針對大容量資料的查詢和分析。hive的sql為使用者提供了多種地方來融合他們自己的方法實現自定義分析 hive不是為事務聯機處理設計的。它是用於處理傳統資料倉儲任務。2...

第一章 C 的基本概念

1 2 我的第乙個c 程式 1 3 程式架構簡介 1 4 其他問題 c c 源自於貝爾實驗室,當初其原創者bjarnestroustrup以c作為基本的架構,再引入物件導向的概念,從而形成了最初的c 語言。因此,c 可以說是包含了整個c語言,也就是說幾乎所有的c語言程式,只要進行微幅的修改,甚至於完...