createClassif: A createClassif Function

Description Usage Arguments Value Author(s) References See Also Examples

View source: R/createClassif.R

Description

Construcci<c3><b3>n y validaci<c3><b3>n externa de un biomarcador.

Usage

1
2
3
4
createClassif(X.tr, Y.tr, learningSets, learnSetNames, selMethodNames,
  numGenes2Sel = c(3, 5, 10), classifierNames, multiclass = FALSE,
  isTunable, resultsDir, compName, niter, ntoplist = 25, X.new, Y.new,
  validation = TRUE, saveXLS = TRUE)

Arguments

X.tr

matriz n<c3><ba>merica con los valores de los datos. Donde las columnas son los "features" y las filas los individuos. Estos datos ser<c3><a1>n usados para la construcci<c3><b3>n del biomarcador

Y.tr

vector de datos de clase "factor" donde se indican las condiciones experimentales (a comparar) de cada individuo indicado en las filas de X.tr

learningSets

An object of class learningsets. May be missing, then the complete datasets is used as learning set.

learnSetNames

m<c3><a9>todo a utilizar para la generaci<c3><b3>n de "learningsSets". Los diferentes m<c3><a9>todos (LOOCV, CV, MCCV, bootstrap) se explican en "See Also"

selMethodNames

vector caracter indicando m<c3><a9>todos de seleccion (m<c3><a1>ximo 3?), ver posibles m<c3><a9>todos en GeneSelection . (p.e: c("t.test"))

numGenes2Sel

vector n<c3><ba>meric donde se indican el n<c3><ba>mero de genes incluidos en cada predictor.

classifierNames

vector caracter indicando el m<c3><a9>todo de classificador usado .(p.ej. c("CMA::dldaCMA", "CMA::rfCMA", "CMA::pnnCMA", "CMA::plrCMA") ), par<c3><a1>metro classifier GeneSelection

multiclass

valor l<c3><b3>gico que indica si se la comparaci<c3><b3>n, es decir, los factores son igual a 3.

resultsDir

carpeta donde se guardaran los resultados. p.e. "results/". Solo necesario cuando saveLearnSet = TRUE

compName

nombre de la comparaci<c3><b3>n, se usara como identificador y para el nombre de archivos resultantes

niter

Number of iterations (s.details).

ntoplist

n<c3><ba>mero de features que se muestran en la lista de candidatos

X.new

Solo si validation = TRUE. matriz n<c3><ba>merica con los valores de los datos. Donde las columnas son los "features" y las filas los individuos. Estos datos ser<c3><a1>n usados para la validaci<c3><b3>n del biomarcador

Y.new

Solo si validation = TRUE. vector de datos de clase "factor" donde se indican las condiciones experimentales (a comparar) de cada individuo indicado en las filas de X.new

validation

valor l<c3><b3>gico que indica si se incluye una base de datos de validaci<c3><b3>n.

saveXLS

valor logico que indica si se guardan los resultados en disco

fold

Gives the number of CV-groups. Used only when method="CV"

Value

candFeat: tablas con los features seleccionados, tanto con identificador n<c3><ba>merico (table_all) como con la etiqueta de cada feature (selectedTable)

cl: resultado en formato "cloutput" de cada uno de los biomarcadores realizados para cada m<c3><a9>todo

ResultsClassif: resultados resumidos de cada biomarcador, en el caso de dos condiciones experimentales se obtienen los siguientes indicadores de calidad: misclassification, sensitivity y specificity. Si son m<c3><a1>s de dos condiciones experimentales obtenemos <c3><ba>nicamente misclassification.

misscls: solo si "validation = TRUE" indica la tasa de misclassification de los nuevos datos sobre los diferentes m<c3><a9>todos utilizados.

Author(s)

Miriam Mota mmota.foix@gmail.com

References

M Slawski, M Daumer and A-L Boulesteix, CMA <e2><80><93> a comprehensive Bioconductor package for supervised classification with high dimensional data

See Also

Text with GeneSelection

Examples

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
 x <- cbind(matrix(rnorm(400,500),nrow = 40),matrix(rnorm(400,5),nrow = 40))
 colnames(x) <- paste0("a",1:ncol(x))
 rownames(x) <- paste0("aa",1:nrow(x))
 y <- factor(c(rep("A",20),rep("B",20)))
 lSet <- prepLearnSets(Y.tr = y , learnSetNames = "LOOCV", compName = "AvsB", saveLearnSet = FALSE)  
 resF <- createClassif(X.tr = x,
                       Y.tr = y,
                      learningSets  = lSet$learningSets,
                      learnSetNames = c("LOOCV"),
                      selMethodNames = c("t.test"),
                      numGenes2Sel = c(3,5,10),
                      classifierNames = c("CMA::dldaCMA", "CMA::rfCMA", "CMA::pnnCMA") , 
                      resultsDir = "example/",
                      compName = "AvsB",
                      validation = FALSE,
                      ntoplist = 10, saveXLS = FALSE)

miriamMota/biom documentation built on May 22, 2019, 11:55 p.m.