Cluster: analysis de cluster.
In MVar.pt: Analise multivariada (brazilian portuguese)

Cluster

R Documentation

analysis de cluster.

Description

Realiza analysis de cluster hierarquico e nao hierarquico em um conjunto de dados.

Usage

Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs",  
        cor.abs = FALSE, normalize = FALSE, distance = "euclidean",  
        method = "complete", horizontal = FALSE, num.groups = 0,
        lambda = 2, savptc = FALSE, width = 3236, height = 2000, 
        res = 300, casc = TRUE)

Arguments

`data`	Dados a serem analizados.
`titles`	Titulos para os graficos, se nao for definido assume texto padrao.
`hierarquic`	Agrupamentos hierarquicos (default = TRUE), para agrupamentos nao hierarquicos (method K-Means), somente para caso 'analysis' = "Obs".
`analysis`	"Obs" para analises nas observacoes (default), "Var" para analises nas variaveis.
`cor.abs`	Matriz de correlacao absoluta caso 'analysis' = "Var" (default = FALSE).
`normalize`	Normaliza os dados somente para caso 'analysis' = "Obs" (default = FALSE).
`distance`	Metrica das distancias caso agrupamentos hierarquicos: "euclidean" (default), "maximum", "manhattan", "canberra", "binary" ou "minkowski". Caso analysis = "Var" a metrica sera a matriz de correlacao, conforme cor.abs.
`method`	Metodo para analises caso agrupamentos hierarquicos: "complete" (default), "ward.D", "ward.D2", "single", "average", "mcquitty", "median" ou "centroid".
`horizontal`	Dendrograma na horizontal (default = FALSE).
`num.groups`	Numero de grupos a formar.
`lambda`	Valor usado na distancia de minkowski.
`savptc`	Salva as imagens dos graficos em arquivos (default = FALSE).
`width`	Largura do grafico quanto savptc = TRUE (defaul = 3236).
`height`	Altura do grafico quanto savptc = TRUE (default = 2000).
`res`	Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).
`casc`	Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Varios graficos.

`tab.res`	Tabela com as similaridades e distancias dos grupos formados.
`groups`	Dados originais com os grupos formados.
`res.groups`	Resultados dos grupos formados.
`R.sqt`	Resultado do R quadrado.
`sum.sqt`	Soma do quadrado total.
`mtx.dist`	Matriz das distancias.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Mingoti, S. A. Analysis de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Examples

data(DataQuan) # conjunto de dados quantitativos

data <- DataQuan[,2:8]

rownames(data) <- DataQuan[1:nrow(DataQuan),1]

res <- Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs",
               cor.abs = FALSE, normalize = FALSE, distance = "euclidean", 
               method = "ward.D", horizontal = FALSE, num.groups = 2,
               savptc = FALSE, width = 3236, height = 2000, res = 300, 
               casc = FALSE)

print("R quadrado:"); res$R.sqt
# print("Soma do quadrado total:"); res$sum.sqt
print("Grupos formados:"); res$groups
# print("Tabela com as similaridades e distancias:"); res$tab.res
# print("Tabela com os resultados dos grupos:"); res$res.groups
# print("Matriz de distancias:"); res$mtx.dist 

write.table(file=file.path(tempdir(),"SimilarityTable.csv"), res$tab.res, sep=";",
            dec=",",row.names = FALSE) 
write.table(file=file.path(tempdir(),"GroupData.csv"), res$groups, sep=";",
            dec=",",row.names = TRUE) 
write.table(file=file.path(tempdir(),"GroupResults.csv"), res$res.groups, sep=";",
            dec=",",row.names = TRUE)

MVar.pt documentation built on April 12, 2025, 9:14 a.m.