R語言 因子

2021-08-18 08:13:09 字數 3100 閱讀 1926

因子是用於對資料進行分類並將其儲存為級別的資料物件。 它們可以儲存字串和整數。 它們在具有有限數量的唯一值的列中很有用。 像「男性」,「女性」和true,false等。它們在統計建模的資料分析中很有用。

使用factor()函式通過將向量作為輸入建立因子。

# create a vector as input.

data <- c("east","west","east","north","north","east","west","west","west","east","north")

print(data)

print(is.factor(data))

factor_data <- factor(data)

print(factor_data)

print(is.factor(factor_data))

當我們執行上面的**,它產生以下結果 -

[1] "east"

"west"

"east"

"north"

"north"

"east"

"west"

"west"

"west"

"east"

"north"

[1] false

[1] east west east north north east west west west east north

levels: east north west

[1] true

資料幀的因子

在建立具有文字資料列的任何資料框時,r語言將文字列視為分類資料並在其上建立因子。

# create the vectors for data frame.

height

<- c(132,151,162,139,166,147,122)

weight

<- c(48,49,66,53,67,52,40)

gender

<- c("male","male","female","female","male","female","male")

# create the data frame.

input_data

<- data.frame(height,weight,gender)

print(input_data)

# test if the gender column is a factor.

print(is.factor(input_data$gender))

# print the gender column so see the levels.

print(input_data$gender)

當我們執行上面的**,它產生以下結果 -

height weight gender

1 132 48 male

2 151 49 male

3 162 66 female

4 139 53 female

5 166 67 male

6 147 52 female

7 122 40 male

[1] true

[1] male male female female male female male

levels: female male

更改級別順序

可以通過使用新的等級次序再次應用因子函式來改變因子中的等級的順序。

data <- c("east","west","east","north","north","east","west","west","west","east","north")

# create the factors

factor_data <- factor(data)

print(factor_data)

new_order_data <- factor(factor_data,levels = c("east","west","north"))

print(new_order_data)

當我們執行上面的**,它產生以下結果 -

[1]

east

west

east

north

north

east

west

west

west

east

north

levels: east

north

west

[1]east

west

east

north

north

east

west

west

west

east

north

levels: east

west

north

生成因子級別

我們可以使用gl()函式生成因子級別。 它需要兩個整數作為輸入,指示每個級別有多少級別和多少次。

語法

gl

(n, k, labels)

以下是所使用的引數的說明 -

v <- gl(3, 4, labels = c("tampa", "seattle","boston"))

print(v)

當我們執行上面的**,它產生以下結果 -

tampa

tampa

tampa

tampa

seattle

seattle

seattle

seattle

boston

[10]

boston

boston

boston

levels: tampa

seattle

boston

R 語言 因子分析

因子分析 options digits 2 covariances ability.cov cov 將協方差矩陣轉化為相關係數矩陣 correlations cov2cor covariances 第一步 判斷需提取的公共因子數 library psych covariances ability.c...

對R語言因子的淺讀

故事開始了 噔噔噔!開學了!一年級的小朋友們入學了啊啊好激動!但是很快,他們人生中第一次正式的考試來了 第一次考試嘛,難免失手!當然了肯定有厲害的人對吧!先假設班裡只有5個人哈 資料不要太多,沒意思 成績如下 小韜 100 小紅 95,小花 80 小兵 75 小懶 56 好了那現在我給他們的成績做個...

R語言 因子的構造 factor函式

參考內容 教程一,非數值型變數 類別變數和順序變數 在r語言中稱為因子,也稱為因子型變數。因子型變數內的所有非重複值,被稱為因子水平 levels 建立因子 在r語言中可以使用factor 函式和gl 函式來建立因子變數。1 使用factor 函式 factor 函式的語法格式為 f factor ...