《資料科學 R語言實現》 3 5 新增新的記錄

2021-09-23 13:47:44 字數 1216 閱讀 3041

熟悉資料庫的讀者,可能已經知道如何執行insert操作,給資料集新增一條新的記錄。你也可以使用alter操作給表新增新的一列(屬性)。在r中,你也可以執行insert和alter操作,但是要簡單得多。我們會在本教程中介紹函式rbind和cbind,以便可以簡單地使用r給當前資料集新增新的記錄或者新的屬性。

按照3.3節「轉換資料型別」教程,把匯入資料的每個屬性轉換成合適的資料型別。同時按照3.2節「重新命名資料變數」中的步驟,命名employees和salaries資料集的列名。

執行下列步驟,給資料集新增新的記錄或者新的屬性。

1.首先,使用rbind給employees新增新的記錄:

2.我們可以把新的結果重新分配給資料框employees:

.3.除了給原始資料集新增新的記錄,我們也可以使用na預設值新增新的position屬性:

4.並且,我們可以根據當前日期和每乙個雇員的birth_date新增新的age屬性:

5.我們也可以使用函式transform新增多個變數:

和資料庫操作類似,我們可以根據資料集的樣式(屬性個數和每個屬性的資料型別)給資料框新增新的記錄。這裡,我們首先介紹了如何使用函式rbind給資料框新增新的記錄。由於雇員資料集有6列,我們可以使用函式rbind給資料集新增含有6個值的記錄。在第一列中,emp_no是整型,所以我們不需要把輸入值放在單引號中。對於屬性first_name和last_name,因為已經把它們的型別轉換成字元型別,所以我們可以自由地輸入任何字串作為乙個值。對於最後乙個gender屬性,它是因子型別的,我們只能輸入m或f作為值。

除了給目標資料集新增新的記錄,我們還可以使用函式cbind新增新的變數。要達到這個目的,我們可以在呼叫cbind的時候給變數指定乙個預設值。這裡我們使用na作為新的position屬性的預設值 。我們也可以把其他列的計算結果拿來作為新的變數。在這個過程中,我們首先利用當前日期和和雇員的生日計算每個雇員的年齡。然後,我們使用美元符號把計算結果指定給新的變數age。除了使用美元符號指定新的變數,我們也可以使用函式transform,為employees資料集建立age、position和marital變數。

除了使用美元符號和函式transform,我們也可以使用函式with建立新的變數:

《資料科學 R語言實現》 1 2 建立R函式

r語言是函式的集合 使用者可以在專案中使用各個程式包中的內建函式,或者為專門的目的定義新的函式。在本教程中,我們會展示如何建立乙個r函式。執行下列步驟來建立你的第乙個r函式。1.在r控制台中鍵入下列 建立第乙個函式 2.使用下列命令,執行使用者定義的函式addnum 或者,你也可以不使用return...

《資料科學 R語言實現》 3 7 捨棄資料

在之前的教程中,我們介紹了如何修改和過濾資料集。這些步驟基本上涵蓋了資料預處理和資料準備的主要過程。但是,我們還想找出資料集中的壞資料。那些壞資料或者不想要的資料應該丟棄,避免生成誤導的結果。這裡,我們會介紹一些移除無用資料的實用方法。按照3.3節 轉換資料型別 教程,把匯入資料的每個屬性轉換成合適...

《資料科學 R語言實現》 3 8 合併資料

資料合併讓我們理解不同資料來源是如何相互關聯的。r中的merge操作與資料庫中的join操作類似,它使用兩個資料集中相同的值來連線兩個資料集。按照3.3節 轉換資料型別 教程,把匯入資料的每個屬性轉換成合適的資料型別。同時按照3.2節 重新命名資料變數 中的步驟,命名employees和salari...