利用R語言進行資料分析時的一些命令

2021-10-05 09:05:54 字數 1190 閱讀 1286

讀取excel中的資料:

命令:read.xlsx("base.xlsx", 1)

報錯:error in make.names(vnames, unique = true)

原因:中文不識別

處理方法:在最後加上encoding = 「utf-8」

data = read.xlsx(「1.xlsx」,1,encoding = 「utf-8」)
關於資料的缺失值:

#01-判斷是否缺失

> a<-c(1,1,na,1)

> is.na(a)

[1] false false true false

#02返回缺失值位置

> which(is.na(a))

[1] 3

#03計算資料集a的缺失值總數

> sum(is.na(a))

[1] 1

找出資料集中有缺失值的行,將其記錄到令乙個資料框中,將原資料框中有缺失值的行刪除:

list <-which(rowsums(is.na(rw_hafu))

> 0)

# hafu資料集中有缺失值的行。

hafu_na <- rw_hafu[list,]

#提取有缺失值的行。

hafu_a <- rw_hafu[-list,]

# 產生無缺失值的行。

檢視包內函式:

檢視base基礎包函式名:ls("package:base")

檢視base包的所有函式和源**:mget(ls("package:base"), inherits = true)

安裝函式包時出現的錯誤:無法在貯藏處

解決方法:出現這個問題的原因是自己的電腦(windows10)設定了**,首先一次找到win10中設定 --> **然後將**介面中的選項全部取消勾選即可。

用R語言進行資料分析

用美國 台網公布的全球2013年5月20日22點到24點發生的所有 的震級資料實驗。mag mag 1 1.6 0.9 2.1 2.2 2.3 1.7 1.3 1.6 4.7 1.2 0.9 4.7 0.6 5.3 1.1 4.8 4.0 4.2 4.6 1.3 2.1 1.5 3.0 factor...

利用python進行資料分析

目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...

利用python進行資料分析

利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...