r語言與指標體系建構

2021-08-14 09:07:15 字數 2223 閱讀 6430

定指標

標準化

求權重的三種方法

pca

ahp

熵值pca 客觀 計量 資料有損失

ahp 主觀 計數/計量 資料無損失

熵值 客觀 計量 資料有損失

重點內容

** pca 王斌會 《多元統計分析及r語言建模》第四版

x1=c(171,175,159,155,152,158,154,164,168,166,159,164)

x2=c(57,64,41,38,35,44,41,51,57,49,47,46)

plot(x1,x2,xlim=c(145,180),ylim=c(25,75))

lines(c(150,178),c(33,66));text(180,68,」y1」)

lines(c(161,168),c(60,38));text(161,63,」y2」)

x=read.table(「clipboard」,header=t) # àý7.2êý¾ý

cor(x)

pca=princomp(x,cor=t)#ö÷³é·ö·öîö

pca#ìøõ÷öµ¿ª¸ùºå½á¹û

options(digits=3)

summary(pca)

pcaloadings#ö÷³é·öôøºé  

par(mar=c(4,4,2,1),cex=0.75)  

screeplot(pca,type=」lines」)  

pcascores[,1:2] #ö÷³é·öµã·ö

library(mvstats)

princomp.rank(pca,m=2)#ö÷³é·öååãû

princomp.rank(pca,m=2,plot=t)#ö÷³é·öååãûóë×÷í¼si

,s2 si,s3$si)#ðî³éµã·öêý¾ý

s_rank(s,a_w)#°´aµãµ½×ûºïµã·ö¼°ååãû

** 熵值:

第一步:指標的歸一化處理(異質指標同質化):由於各項指標的計量單位並不統一,因此在用他們計算綜合指標前,先要進行標準化處理,即把指標的絕對值轉化為相對值,從而解決各項不同質指標值的同質化問題。

另外,正向指標和負向指標數值代表的含義不同(正向指標數值越高越好,負向指標數值越低越好),因此,對於正向、負向指標需要採用不同的演算法進行資料標準化處理。

正向指標:

這裡寫描述

負向指標:

這裡寫描述

第二步:計算第j項指標下第i個樣本值佔該指標的比重。

這裡寫描述

第三步:計算第j項指標的熵值。

這裡寫描述

第四步:計算資訊熵冗餘度(差異)。

這裡寫描述

第五步:計算各項指標的權重。

這裡寫描述

第六步:計算各樣本的綜合得分。

這裡寫描述

指令碼實現

資料讀入。

library(forecast)

library(xlconnect)

sourui <- read.csv(「e:/r/operation/train.csv」,header = t)

1 2

3 部分資料展現

這裡寫描述

索引列刪除

sourui$案例 <- null

1 第一步:歸一化處理。

min.max.norm <- function(x)

max.min.norm <- function(x)

sourui_t <- cbind(sourui_1,sourui_2)

1 2

3 4

5 6

7 8

9 10

11 12

第二步:求出所有樣本對指標xj的貢獻總量

k <- 1/log(length(dataframe1[,1]))

d <- -k * colsums(dataframe1)

1 2

3 4

5 6

7 8

9 10

11 12

13 14

15 16

第四步:計算冗餘度。

d <- 1-d

1 第五步:計算各項指標的權重。

w <- d/sum(d)

w 1

2 最終輸出結果展現

這裡寫描述

《R語言入門與實踐》第四章 R 的記號體系

這一章節將如何對 r 物件中的值進行選取,r 的符號規則有兩種方式進行查詢 第一種記號體系 索引 查詢索引語法 deck 使用中括號 其中 為索引,其中含有兩個索引引數,用 分隔 在 r 中,有六種方式建立並使用索引,分別為 正整數索引 負整數索引零空格 邏輯值名稱 第二種記號體系 和 格式 dec...

R語言與商業智慧型

1 使用window的貼上功能先複製excle中的資料x read.table clipboard 從貼上板讀取資料write.table x x,file clipboard sep t 把資料寫到貼上板,貼上到excle中就可以了2 儲存輸出 sink myresult.txt 吧以下結果存在m...

R語言 迴圈與條件

迴圈 for n in x expr r中最基本的是for迴圈,其中n為迴圈變數,x通常是乙個序列。n在每次迴圈時從x中順序取值,代入到後面的expr語句中進行運算。下面的例子即是以for迴圈計算30個fibonacci數。x c 1,1 for i in 3 30 例子1pv c 1,1,2,3,...