createClassif: A createClassif Function

Description Usage Arguments Value Author(s) References See Also Examples

View source: R/createClassif.R

Description

Construcción y validación externa de un biomarcador.

Usage

1
2
3
4
createClassif(X.tr, Y.tr, learningSets, learnSetNames, selMethodNames,
  numGenes2Sel = c(3, 5, 10), classifierNames, multiclass = FALSE,
  isTunable, resultsDir, compName, niter, ntoplist = 25, X.new, Y.new,
  validation = TRUE, saveXLS = TRUE)

Arguments

X.tr

matriz númerica con los valores de los datos. Donde las columnas son los "features" y las filas los individuos. Estos datos serán usados para la construcción del biomarcador

Y.tr

vector de datos de clase "factor" donde se indican las condiciones experimentales (a comparar) de cada individuo indicado en las filas de X.tr

learningSets

An object of class learningsets. May be missing, then the complete datasets is used as learning set.

learnSetNames

método a utilizar para la generación de "learningsSets". Los diferentes métodos (LOOCV, CV, MCCV, bootstrap) se explican en "See Also"

selMethodNames

vector caracter indicando métodos de seleccion (máximo 3?), ver posibles métodos en GeneSelection . (p.e: c("t.test"))

numGenes2Sel

vector númeric donde se indican el número de genes incluidos en cada predictor.

classifierNames

vector caracter indicando el método de classificador usado .(p.ej. c("CMA::dldaCMA", "CMA::rfCMA", "CMA::pnnCMA", "CMA::plrCMA") ), parámetro classifier GeneSelection

multiclass

valor lógico que indica si se la comparación, es decir, los factores son igual a 3.

resultsDir

carpeta donde se guardaran los resultados. p.e. "results/". Solo necesario cuando saveLearnSet = TRUE

compName

nombre de la comparación, se usara como identificador y para el nombre de archivos resultantes

niter

Number of iterations (s.details).

ntoplist

número de features que se muestran en la lista de candidatos

X.new

Solo si validation = TRUE. matriz númerica con los valores de los datos. Donde las columnas son los "features" y las filas los individuos. Estos datos serán usados para la validación del biomarcador

Y.new

Solo si validation = TRUE. vector de datos de clase "factor" donde se indican las condiciones experimentales (a comparar) de cada individuo indicado en las filas de X.new

validation

valor lógico que indica si se incluye una base de datos de validación.

saveXLS

valor logico que indica si se guardan los resultados en disco

fold

Gives the number of CV-groups. Used only when method="CV"

Value

candFeat: tablas con los features seleccionados, tanto con identificador númerico (table_all) como con la etiqueta de cada feature (selectedTable)

cl: resultado en formato "cloutput" de cada uno de los biomarcadores realizados para cada método

ResultsClassif: resultados resumidos de cada biomarcador, en el caso de dos condiciones experimentales se obtienen los siguientes indicadores de calidad: misclassification, sensitivity y specificity. Si son más de dos condiciones experimentales obtenemos únicamente misclassification.

misscls: solo si "validation = TRUE" indica la tasa de misclassification de los nuevos datos sobre los diferentes métodos utilizados.

Author(s)

Miriam Mota [email protected]

References

M Slawski, M Daumer and A-L Boulesteix, CMA – a comprehensive Bioconductor package for supervised classification with high dimensional data

See Also

Text with GeneSelection

Examples

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
 x <- cbind(matrix(rnorm(400,500),nrow = 40),matrix(rnorm(400,5),nrow = 40))
 colnames(x) <- paste0("a",1:ncol(x))
 rownames(x) <- paste0("aa",1:nrow(x))
 y <- factor(c(rep("A",20),rep("B",20)))
 lSet <- prepLearnSets(Y.tr = y , learnSetNames = "LOOCV", compName = "AvsB", saveLearnSet = FALSE)  
 resF <- createClassif(X.tr = x,
                       Y.tr = y,
                      learningSets  = lSet$learningSets,
                      learnSetNames = c("LOOCV"),
                      selMethodNames = c("t.test"),
                      numGenes2Sel = c(3,5,10),
                      classifierNames = c("CMA::dldaCMA", "CMA::rfCMA", "CMA::pnnCMA") , 
                      resultsDir = "example/",
                      compName = "AvsB",
                      validation = FALSE,
                      ntoplist = 10, saveXLS = FALSE)

miriamMota/biom documentation built on April 13, 2018, 7:32 p.m.