大資料之R語言是什麼?

2021-09-11 15:23:25 字數 1480 閱讀 9104

r是用於統計分析、繪圖的語言和操作環境。r是屬於gnu系統的乙個自由、免費、源**開放的軟體,它是乙個用於統計計算和統計製圖的優秀工具。

發展歷史

r是統計領域廣泛使用的誕生於2023年左右的s語言的乙個分支。可以認為r是s語言的一種實現。而s語言是由at&t貝爾實驗室開發的一種用來進行資料探索、統計分析和作圖的解釋型語言。最初s語言的實現版本主要是s-plus。s-plus是乙個商業軟體,它基於s語言,並由mathsoft公司的統計科學部進一步完善。後來紐西蘭奧克蘭大學的robert gentleman和ross ihaka及其他志願人員開發了乙個r系統。由「r開發核心團隊」負責開發。r可以看作貝爾實驗室(at&t belllaboratories)的rickbecker,johnchambers和allanwilks開發的s語言的一種實現。當然,s語言也是s-plus的基礎。所以,兩者在程式語法上可以說是幾乎一樣的,可能只是在函式方面有細微差別,程式十分容易地就能移植到一程式中,而很多一的程式只要稍加修改也能運用於r。

r語言的特點

r作為一種統計分析軟體,是集統計分析與圖形顯示於一體的。它可以執行於unix,windows和macintosh的作業系統上,而且嵌入了乙個非常方便實用的幫助系統,相比於其他統計分析軟體,r還有以下特點:

2.r是一種可程式設計的語言。作為乙個開放的統計程式設計環境,語法通俗易懂,很容易學會和掌握語言的語法。而且學會之後,我們可以編制自己的函式來擴充套件現有的語言。這也就是為什麼它的更新速度比一般統計軟體,如,spss,sas等快得多。大多數最新的統計方法和技術都可以在r中直接得到。

所有r的函式和資料集是儲存在程式包裡面的。只有當乙個包被載入時,它的內容才可以被訪問。一些常用、基本的程式包已經被收入了標準安裝檔案中,隨著新的統計分析方法的出現,標準安裝檔案中所包含的程式包也隨著版本的更新而不斷變化。在另外版安裝檔案中,已經包含的程式包有:base一r的基礎模組、mle一極大似然估計模組、ts一時間序列分析模組、mva一多元統計分析模組、survival一生存分析模組等等.

4.r具有很強的互動性。除了圖形輸出是在另外的視窗處,它的輸入輸出視窗都是在同乙個視窗進行的,輸入語法中如果出現錯誤會馬上在視窗口中得到提示,對以前輸入過的命令有記憶功能,可以隨時再現、編輯修改以滿足使用者的需要。輸出的圖形可以直接儲存為jpg,bmp,png等格式,還可以直接儲存為pdf檔案。另外,和其他程式語言和資料庫之間有很好的介面。

5.如果加入r的幫助郵件列表一,每天都可能會收到幾十份關於r的郵件資訊。可以和全球一流的統計計算方面的專家討論各種問題,可以說是全世界最大、最前沿的統計學家思維的聚集地。

r是基於s語言的乙個gnu專案,所以也可以當作s語言的一種實現,通常用s語言編寫的**都可以不作修改的在r環境下執行。 r的語法是來自scheme。r的使用與s-plus有很多類似之處,這兩種語言有一定的相容性。s-plus的使用手冊,只要稍加修改就可作為r的使用手冊。所以有人說:r,是s-plus的乙個「轉殖」。

關於r語言的基礎知識:

r語言的基礎認識與入門速成

阿里雲大學官網(阿里雲大學 - 官方**,雲生態下的創新人才工場)

大資料基礎 R語言

目錄 1.r語言是解釋性語言還是編譯性語言?2.簡述r語言的基本功能。3.r語言通常用在哪些領域?4.r語言常用的分類和 演算法有哪些?5.簡述如何利用r程式包進行資料分析 建模和資料 6.如何使用 聚類 和 分類 對資料樣本進行分組。7.sparkr dataframe的作用有哪些?8.簡述spa...

大資料之R語言速成與實戰

阿里雲大學 大資料之r語言速成與實戰 r是用於統計分析 繪圖的語言和操作環境,屬於gnu系統的乙個自由 免費 源 開放的軟體,它是乙個用於統計計算和統計製圖的優秀工具。r語言語法通俗易懂,很容易學會和掌握語言的語法。而且學會之後,我們可以編制自己的函式來擴充套件現有的語言。這也就是為什麼它的更新速度...

大資料之R語言速成與實戰

內容了解 r 是用於統計分析 繪圖的語言和操作環境。r是屬於gnu系統的乙個自由 免費 源 開放的軟體,它是乙個用於統計計算和統計製圖的優秀工具。關於r的乙個比較準確的描述是 r是一門用於統計計算和作圖的語言,它不單是一門語言,更是乙個資料計算與分析的環境。統計計算領域有三大工具 sas spss ...