r語言聚類分析 R語言實現tSNE聚類分析

2021-10-12 06:45:29 字數 1199 閱讀 4525

t-sne(t-distributed stochastic neighborembedding)是用於降維的一種無監督機器學習演算法,由 laurens van der maaten 和 geoffrey hinton在08年提出。t-sne 作為一種非線性降維演算法,非常適用於高維資料降維到2維或者3維,便於進行視覺化。與pca比較就可以很顯然的看出,經過pca處理過後的結果能夠得知每乙個成分的方差貢獻度(解釋方差),然後t-sne僅僅是基於相似度進行判定,沒辦法從其結果推斷類似的資訊。

接下來我們看下在r中的實現過程,首先我們需要安裝包rtsne。

install.packages("rtsne")
我們直接看下例項:

library(rtsne)#資料的載入iris_unique # 去除重複的值iris_matrix as.matrix(iris_unique[,x ##如果資料屬性差異太大
##執行模型set.seed(42)#保證資料結果一致性tsne_out false,perplexity=plot(tsne_out$y,col=iris_unique$species,asp=1)

###標準化後tsne_out plot(tsne_out$y,col=iris_unique$species,asp=1)

當然,為了更加的美觀,我們可以借助ggplot2包繪製結果。

歡迎學習交流!

聚類分析 Kmeans演算法理解及R語言實現

一 基本解釋 演算法思想 名詞解釋 演算法 1 在總體中隨機選擇k個值作為初始質心。2 計算每個樣本點到每個質心的距離 一般為歐式距離 將每個點指派到最近的質心點,形成k個聚類。3 重新這個簇的樣本點的平均值,作為簇的新質心。4 重複2 3直至質心不再發生變化,或者只發生很微小的變化。名詞解釋 關於...

基於R語言實現Lasso回歸分析

主要步驟 將資料存成csv格式,逗號分隔 在r中,讀取資料,然後將資料轉成矩陣形式 載入lars包,先安裝 呼叫lars函式 確定cp值最小的步數 確定篩選出的變數,並計算回歸係數 具體 如下 需要注意的地方 1 資料讀取的方法,這裡用的file.choose 這樣做的好處是,會彈出視窗讓你選擇你要...

R語言實現KNN 演算法

knn是機器學習中最簡單的分類演算法之一 就是把每乙個測試樣本跟訓練樣本中的每乙個樣本求他們的歐式距離,然後選出最小的幾個,裡面哪乙個類多 這個測試樣本就屬於哪乙個類 用r語言自帶的iris 寫了一下 data iris length iris 1 idx sample 150,100 train ...