第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

R中的聚類分析:確定最優(yōu)聚類數(shù)

R中的聚類分析:確定最優(yōu)聚類數(shù)

白板的微信 2019-07-04 18:06:04
R中的聚類分析:確定最優(yōu)聚類數(shù)作為R領(lǐng)域的新手,我不太確定如何選擇最佳的簇數(shù)來進行k-均值分析。在繪制了以下數(shù)據(jù)的子集之后,有多少個集群才是合適的呢?如何進行聚類樹分析?n = 1000kk = 10    x1 = runif(kk)y1 = runif(kk)z1 = runif(kk)     x4 = sample(x1,length(x1))y4 = sample(y1,length(y1)) randObs <- function(){   ix = sample( 1:length(x4), 1 )   iy = sample( 1:length(y4), 1 )   rx = rnorm( 1, x4[ix], runif(1)/8 )   ry = rnorm( 1, y4[ix], runif(1)/8 )   return( c(rx,ry) )}  x = c()y = c()for ( k in 1:n ){   rPair  =  randObs()   x  =  c( x, rPair[1] )   y  =  c( y, rPair[2] )}z <- rnorm(n)d <- data.frame( x, y, z )
查看完整描述

3 回答

?
青春有我

TA貢獻1784條經(jīng)驗 獲得超8個贊

很難再加上這么詳細的答案了。雖然我覺得我們應該提一下identify這里,特別是因為@Ben顯示了大量的樹狀圖示例。

d_dist <- dist(as.matrix(d))   # find distance matrix plot(hclust(d_dist)) clusters <- identify(hclust(d_dist))

identify允許您交互地從樹狀圖中選擇集群,并將您的選擇存儲到列表中。點擊ESC離開互動模式,并返回到R控制臺。注意,列表包含索引,而不是行名(與cutree).


查看完整回答
反對 回復 2019-07-04
?
慕碼人2483693

TA貢獻1860條經(jīng)驗 獲得超9個贊

為了確定聚類方法中的最優(yōu)k-聚類。我通常用Elbow方法伴隨并行處理以避免時間消耗.此代碼可以這樣進行示例:

彎頭法

elbow.k <- function(mydata){dist.obj <- dist(mydata)hclust.obj <- hclust(dist.obj)css.obj 
<- css.hclust(dist.obj,hclust.obj)elbow.obj <- elbow.batch(css.obj)k <- elbow.obj$kreturn(k)}

運行彎頭并聯(lián)

no_cores <- detectCores()
    cl<-makeCluster(no_cores)
    clusterEvalQ(cl, library(GMD))
    clusterExport(cl, list("data.clustering", "data.convert", "elbow.k", "clustering.kmeans"))
 start.time <- Sys.time()
 elbow.k.handle(data.clustering))
 k.clusters <- parSapply(cl, 1, function(x) elbow.k(data.clustering))
    end.time <- Sys.time()
    cat('Time to find k using Elbow method is',(end.time - start.time),'seconds with k value:', k.clusters)

效果很好。


查看完整回答
反對 回復 2019-07-04
  • 3 回答
  • 0 關(guān)注
  • 2148 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號