3 3 資料框的子集

2022-06-19 22:06:16 字數 936 閱讀 9773

> x <- data.frame(v1=1:5,v2=6:10,v3=11:15)

> x

v1 v2 v3

1 1 6 11

2 2 7 12

3 3 8 13

4 4 9 14

5 5 10 15

> x$v3[c(2,4)] <- na

> x

v1 v2 v3

1 1 6 11

2 2 7 na

3 3 8 13

4 4 9 na

5 5 10 15

> #找出第2列

> x[,2]

[1] 6 7 8 9 10

> x[,"v2"]

[1] 6 7 8 9 10

> x[( x$v1<4&x$v2>= 8),] #找出第1列小於4並且第2列大於等於8的元素

v1 v2 v3

3 3 8 13

> x[x$v1>2,] #第1列大於2的所有元素

v1 v2 v3

3 3 8 13

4 4 9 na

5 5 10 15

> x[which(x$v1>2),] #使用which函式篩選第1列大於2的所有元素

v1 v2 v3

3 3 8 13

4 4 9 na

5 5 10 15

> ?which

> which(x$v1>2)

[1] 3 4 5

> x$v1>2

[1] false false true true true

> subset(x,x$v1>2) #和上面的操作一樣,篩選第1列大於2的所有元素

v1 v2 v3

3 3 8 13

4 4 9 na

5 5 10 15

pandas 資料子集的獲取

有時資料讀入後並不是對整體資料進行分析,而是資料中的部分子集,例如,對於地鐵乘客量可能只關心某些時間段的流量,對於商品的交易可能只需要分析某些顏色的 變動,對於醫療診斷資料可能只對某個年齡段的人群感興趣等。所以,該如何根據特定的條件實現資料子集的獲取將是本節的主要內容。通常,在pandas模組中實現...

匯入表資料子集

匯入表資料子集 我們可以匯入表的使用sqoop匯入工具,where 子句的乙個子集。它執行在各自的資料庫伺服器相應的 sql查詢,並將結果儲存在 hdfs 的目標目錄。where子句的語法如下。where 下面的命令用來匯入emp add表資料的子集。子集查詢檢索員工 idsecunderabad ...

3 3 可變資料的模型

3.3 可變資料的模型 第二章中提到了復合資料作為組裝有幾個部分的 計算物件的一種方法,為了實現對真實世界中,有 幾個部分的物件進行模擬 在那一章中,我們介紹了資料抽象的原則,根據術語,資料結構被稱為組裝子 用來建立資料物件 選擇子 用來訪問復合的資料物件的每乙個部分 但是現在我們 知道資料有乙個在...