拓端tecdat R語言用多重插補法估算相對風險

2021-09-26 22:19:52 字數 2139 閱讀 8204

在這裡,我將用r中的乙個小模擬示例進行說明。首先,我們使用x1和x2雙變數法線和y模擬大型資料集,其中y遵循給定x1和x2的邏輯模型。

首先,我們模擬乙個非常大的完整資料集:

#simulate完整資料

expit < - function(x)

n < - 100000

x < - mvrnorm(n,mu = c(0,0),sigma =(c(1,0.2,0.2,1),nrow = 2))

x1 < - x [,1]

x2 < - x [,2]

y < - 1 *(runif(n)接下來,我們估計將x1從1更改為0的影響的邊際風險比:

#estimate x1 = 1 vs x1 = 0的邊際風險比,標準化為完整資料

#以後用於mi,我們將編寫乙個獲取資料集並返回此估計值的函式

marginalriskratio < - function(inputdata)

fulldata < - data.frame(y = y,x1 = x1,x2 = x2)

marginalriskratio(fulldata)

[1] 2.295438

接下來,我們使用sullivan 等人考慮的一種機制,在y和x2中缺少一些值:

根據sullivan等人的說法,#make缺少一些資料

z1 < - x1 / 0.2 ^ 0.5

r_y < - 1 *(runif(n)現在我們可以在y和x2中估算缺失的值。指定邏輯結果模型的缺失結果以及來自與邏輯結果模型相容的插補模型的缺失協變數值:

numimps < - 10

imps < - (obsdata,smtype =「logistic」,smformula =「y~x1 + x2」,

method = c(「」,「」,「norm」),m = numimps)

[1] "outcome variable(s): y"

[1] "passive variables: "

[1] "partially obs. variables: x2"

[1] "fully obs. substantive model variables: x1"

[1] "imputation 1"

[1] "imputing missing outcomes using specified substantive model."

[1] "imputing: x2 using x1 plus outcome"

[1] "imputation 2"

[1] "imputation 3"

[1] "imputation 4"

[1] "imputation 5"

[1] "imputation 6"

[1] "imputation 7"

[1] "imputation 8"

[1] "imputation 9"

[1] "imputation 10"

warning message:

in smcfcs.core(originaldata, smtype, smformula, method, predictormatrix, :

rejection sampling failed 7 times (across all variables, iterations, and imputations). you may want to increase the rejection sampling limit.

最後,我們可以應用我們之前定義的函式來估算每個估算資料集的邊際風險比,並使用魯賓規則(即採用對數風險比的平均值)將它們結合起來:

estlogrr <- array(0, dim=numimps)

for (i in 1:numimps)

#pooled estimate of log risk ratio is

mean(estlogrr)

[1] 0.8325685

#and estimate of risk ratio

exp(mean(estlogrr))

[1] 2.299217

我們在插補後得到乙個非常接近完整資料估計的估計值。 

拓端tecdat R語言使用混合模型進行聚類

混合模型是k個分量分布的混合,它們共同形成混合分布 f x f x f x k 1 f x f x k 1k kfk x 讓我們通過乙個例子激發您為何使用混合模型的原因。讓我們說有人向您展示了以下密度圖 我們可以立即看到所得到的分布似乎是雙峰的 即有兩個凸起 表明這些資料可能來自兩個不同的 head...

拓端tecdat R語言旅行推銷員問題TSP

常用術語中的旅行推銷員問題 tsp 是最複雜的問題之一,歸結為組合優化。旅行到n個城市 頂點 需要檢查 n 1 可能性。3,000個地點有4 10 9131個可能的解決方案。以下 輸入您的tsp225.csv檔案並輸出您的解決方案和視覺化。生成的 tour 物件是一類tour和整數 它包含您的解決方...

拓端tecdat R語言最優化問題中的共軛函式

在回歸模型研究中,我們將討論優化,而經典工具就是所謂的共軛。給定函式f rp r,其共軛值為函式f rp r使得 視覺化考慮乙個簡單的拋物線函式 在維度1中 f x x 2 2,然後f 2 是線x 2x與函式f x 之間的最大距離。f function x x 2 2 fstar function ...