evalclust: Cluster Quality Evaluation of Nominal Data Hierarchical...
In nomclust: Hierarchical Cluster Analysis of Nominal Data

evalclust

R Documentation

Cluster Quality Evaluation of Nominal Data Hierarchical Clustering

Description

The function evaluates clustering results by a set of evaluation criteria (cluster validity indices).

Usage

evalclust(data, clusters, diss = NULL)

Arguments

`data`	A data.frame or a matrix with cases in rows and variables in columns.
`clusters`	A data.frame or a list of cluster memberships obtained based on the dataset defined in the parameter `data` in the form of a sequence from the two-cluster solution to the maximal-cluster solution.
`diss`	An optional parameter. A matrix or a dist object containing dissimilarities calculated based on the dataset defined in the parameter `data`.

Details

The function calculates a set of evaluation criteria if the original dataset and the cluster membership variables are provided. The function calculates up to 13 evaluation criteria described by (Sulc et al., 2018) and (Corter and Gluck, 1992) and provides the optimal number of clusters based on these criteria. It is primarily focused on evaluating hierarchical clustering results obtained by similarity measures different from those that occur in the nomclust package. Thus, it can serve for the comparison of various similarity measures for categorical data.

Value

The function returns a list with three components.

The eval component contains up to 13 evaluation criteria as vectors in a list. Namely, Within-cluster mutability coefficient (WCM), Within-cluster entropy coefficient (WCE), Pseudo F Indices based on the mutability (PSFM) and the entropy (PSFE), Bayesian (BIC), and Akaike (AIC) information criteria for categorical data, the BK index, Category Utility (CU), Category Information (CI), Hartigan Mutability (HM), Hartigan Entropy (HE) and, if the prox component is present, the silhouette index (SI) and the Dunn index (DI).

The opt component is present in the output together with the eval component. It displays the optimal number of clusters for the evaluation criteria from the eval component, except for WCM and WCE, where the optimal number of clusters is based on the elbow method.

The call component contains the function call.

Author(s)

Zdenek Sulc.
Contact: zdenek.sulc@vse.cz

References

Corter J.E., Gluck M.A. (1992). Explaining basic categories: Feature predictability and information. Psychological Bulletin 111(2), p. 291–303.

Sulc Z., Cibulkova J., Prochazka J., Rezankova H. (2018). Internal Evaluation Criteria for Categorical Data in Hierarchical Clustering: Optimal Number of Clusters Determination, Metodoloski Zveski, 15(2), p. 1-20.

Examples

# sample data
data(data20)

# creating an object with results of hierarchical clustering
hca.object <- nomclust(data20, measure = "iof", method = "average", clu.high = 7)

# the cluster memberships
data20.clu <- hca.object$mem

# obtaining evaluation criteria for the provided dataset and cluster memberships
data20.eval <- evalclust(data20, clusters = data20.clu)

# visualization of the evaluation criteria
eval.plot(data20.eval)

# silhouette index can be calculated if the dissimilarity matrix is provided
data20.eval <- evalclust(data20, clusters = data20.clu, diss = hca.object$prox)
eval.plot(data20.eval, criteria = "SI")

nomclust documentation built on Aug. 18, 2023, 5:06 p.m.

nomclust index

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

nomclust
Hierarchical Cluster Analysis of Nominal Data

evalclust: Cluster Quality Evaluation of Nominal Data Hierarchical...
In nomclust: Hierarchical Cluster Analysis of Nominal Data

Cluster Quality Evaluation of Nominal Data Hierarchical Clustering

Description

Usage

Arguments

Details

Value

Author(s)

References

See Also

Examples

Related to evalclust in nomclust...

R Package Documentation

Browse R Packages

We want your feedback!

nomclust Hierarchical Cluster Analysis of Nominal Data

evalclust: Cluster Quality Evaluation of Nominal Data Hierarchical... In nomclust: Hierarchical Cluster Analysis of Nominal Data

Cluster Quality Evaluation of Nominal Data Hierarchical Clustering

Description

Usage

Arguments

Details

Value

Author(s)

References

See Also

Examples

Related to evalclust in nomclust...

R Package Documentation

Browse R Packages

We want your feedback!

nomclust
Hierarchical Cluster Analysis of Nominal Data

evalclust: Cluster Quality Evaluation of Nominal Data Hierarchical...
In nomclust: Hierarchical Cluster Analysis of Nominal Data