R隨機抽樣

2021-08-05 23:42:57 字數 1430 閱讀 1270

#x為總體向量 n為樣本容量 

#replace=f表示無放回抽樣 replace=t表示放回抽樣

#prob可以設定不等概率抽樣

#sample(x,n, replace = f, prob = null)

># 用r模擬擲硬幣 h表示正面 t表示反面 有放回抽樣

> sample(c('h','t'),10,replace=t)

[1] "h"

"t""t"

"t""t"

"h""t"

"h""t"

"t">

> a

> a

[1] "1 1"

"2 1"

"3 1"

"4 1"

"5 1"

"6 1"

"1 2"

"2 2"

"3 2"

[10] "4 2"

"5 2"

"6 2"

"1 3"

"2 3"

"3 3"

"4 3"

"5 3"

"6 3"

[19] "1 4"

"2 4"

"3 4"

"4 4"

"5 4"

"6 4"

"1 5"

"2 5"

"3 5"

[28] "4 5"

"5 5"

"6 5"

"1 6"

"2 6"

"3 6"

"4 6"

"5 6"

"6 6"

> sample(a,10,replace=t)# 模擬擲兩個骰子十次

[1] "5 3"

"2 3"

"1 3"

"4 4"

"6 1"

"5 1"

"2 1"

"6 4"

"1 5"

[10] "2 6"

>

> x 

> y

> par(mfrow=c(1,2)) #設定繪圖視窗為 1 x 2

> hist(x,breaks=16,col=gray(.9),main='histogram of source data') #繪製原始資料直方圖

> hist(y,breaks=16,col=gray(.9),main='histogram of bootstrap example') #繪製bootstrap樣本直方圖

>

結果如下圖:

可以發現,bootstrap重抽樣之後的樣本繪製的直方圖較接近原始資料的直方圖

mR 隨機抽樣

1.問題由來 google曾經有一道非常經典的面試題 給你乙個長度為n的鍊錶。n很大,但你不知道n有多大。你的任務是從這n個元素中隨機取出k個元素。你只能遍歷這個鍊錶一次。你的演算法必須保證取出的元素恰好有k個,且它們是完全隨機的 出現概率均等 這道題的解法非常多,網上討論也非常熱烈。本文要討論的是...

MySQL隨機抽樣

最近由於需要大概研究了一下mysql的隨機抽取實現方法。舉個例子,要從tablename表中隨機提取一條記錄,大家一般的寫法就是 select from tablename order by rand limit 1。但是,後來我查了一下mysql的官方手冊,裡面針對rand 的提示大概意思就是,在...

hive 隨機抽樣

1.random sampling syntax select from distribute by rand sort by rand limit 2.bucket table sampling 該方式是最佳化取樣bucket表。rand 函式也可以用來取樣整行。如果取樣列同時使用了cluster...