R/complex.R
In classyfire: Robust multivariate classification using highly optimised SVM ensembles

# ************************************************************************
# Main functions for the heuristic
# 
# Private Functions: 
#    .boxRadial:    Function to generate the classification ensemble (includes training/optimisation and testing)
#    .randSamples:  Function for stratified holdout 
#    .radialSVM:    Cost function for heuristic algorithm
#    .complexFunc:  Box constrained simplex
#
# ************************************************************************

.boxRadial <- function(seed, inputData, inputClass, bootNum, scaling) {
  runTime = system.time({
    testSamples = complexRes = c()
     
    # seed - iteration number of the ensemble and used by snowfall for parallel programming
    set.seed(seed)
    
    # A random fraction of samples is kept aside as an independent test set during training 
    # The remaining samples consist the training dataset
    testSamples <- .randSamples(seed, inputClass)
    trainData   <- inputData[-testSamples,]
    testData    <- inputData[testSamples,]
    trainClass  <- inputClass[-testSamples]
    testClass   <- inputClass[testSamples]
    
    # Perform bootstrapping on the training data
    b <- boot(data = trainClass, statistic = .bootIndx, R = bootNum)
    bootRes <- b$t
    
    # Random initial points for the heuristic
    x1 <- sample(-14:4, 1)
    x2 <- sample(-4:11, 1)
    
    # Train/optim with the complex algorithm 
    complexRes <- .complexFunc(iterNum = seed, initPoints = c(x1,x2), bootRes = bootRes, trainData = trainData, trainClass = trainClass, scaling = scaling)
      
    # Build final SVM with optimal hyperparams
    svmMod    <- svm(trainData, trainClass, type="C-classification", kernel="radial",  gamma= 2^(complexRes$xopt[1]), cost= 2^(complexRes$xopt[2]), scale = scaling)
    predTest  <- predict(svmMod, testData)
    predTrain <- predict(svmMod, trainData)
    
    # Get the overall accuracies
    trueTest  <- length(which(predTest == testClass, arr.ind=TRUE))
    trueTrain <- length(which(predTrain == trainClass, arr.ind=TRUE))
    accTest   <- (trueTest*100)/length(testClass)
    accTrain  <- (trueTrain*100)/length(trainClass)
    
    if (is.null(rownames(testData))) {
      rownames(testData) <- 1:nrow(testData)
    }
    
    # Get the names of missclassified and correctly classified samples (if given)
    missNames <- rownames(testData)[which((predTest != testClass), arr.ind=TRUE)]
    accNames  <- rownames(testData)[which((predTest == testClass), arr.ind=TRUE)]
    
    Predicted  <- predTest
    Test_Class <- testClass
    names(predTest) <- NULL
  })
  
  return(list(testAcc     = accTest,
              trainAcc    = accTrain,
              optGamma    = complexRes$xopt[1], 
              optCost     = complexRes$xopt[2],
              runTime     = runTime,
              confMatr    = table(Predicted, Test_Class),
              predClass   = predTest,
              testClass   = testClass,
              missNames   = missNames,
              accNames    = accNames, 
              testIndx    = testSamples, 
              svmModel    = svmMod))
}

# Function for stratified holdout 
.randSamples <- function(iter, classVec) {
  testSamples = c()
  set.seed(iter)
  
  # Count the different levels in the classVec
  classVec    <- as.factor(as.matrix(classVec))  
  classLevels <- levels(classVec)
  classLength <- length(classLevels)
  
  # Store 1/3 of the samples from each class in the testSamples vector
  for (j in 1:classLength) {
    indx <- which(classVec == classLevels[j])
    testSamples <- c(testSamples, sample(indx, round(length(indx)/3), replace=FALSE))
  }
  
  return(testSamples)
}


# Cost function
.radialSVM <- function(x= NULL, index = NULL, fmsfundata = NULL) {
  cErr <- c()
  
  # Passed arguments 
	bootIndices <- fmsfundata$bootRes
	trainData   <- fmsfundata$trainData
	trainClass  <- fmsfundata$trainClass
  scaling     <- fmsfundata$scaling
	
	for (i in 1:nrow(bootIndices)) {
		indices      <- bootIndices[i,]
		bTrainData   <- trainData[indices,]
		bTestData    <- trainData[-indices,]
		bTrainClass  <- trainClass[indices]
		bTestClass   <- trainClass[-indices]
    
		rownames(bTrainData) <- NULL
		
    # Construct the SVM model for each boostrap iteration
		svmMod    <- svm(bTrainData, bTrainClass, type="C-classification", kernel="radial",  gamma= 2^(x[1]), cost= 2^(x[2]), scale = scaling)
    predClass <- predict(svmMod, bTestData)
		falseTest <- length(which(as.vector(predClass) != as.vector(bTestClass), arr.ind=TRUE))
		missclass <- (falseTest*100)/length(bTestClass)
		cErr      <- c(cErr, missclass)
	}
  
  # Get the average error from all bootstraps
	avgSVMerr <- round(mean(cErr), digits=2)
	
	return(list( f = avgSVMerr, g = c(), c = c(), gc = c(), index = index, this = list(costfargument = fmsfundata)))
}


# Box constrained simplex
.complexFunc <- function(iterNum = NULL, initPoints = NULL, bootRes = NULL, trainData = NULL, trainClass = NULL, scaling = NULL) {
	set.seed(iterNum)
	x0 <- transpose(c(initPoints[1], initPoints[2]))
	
	fmsfundata <- structure(list(bootRes=bootRes, trainData=trainData, trainClass=trainClass, scaling=scaling), class='optimbase.functionargs')
	
  # Configure the neldermead algorithm for the RBF SVM cost function (.radial SVM)
	nm <- neldermead()
	nm <- neldermead.set(nm, 'numberofvariables', 2)
	nm <- neldermead.set(nm, 'costfargument', fmsfundata)
	nm <- neldermead.set(nm, 'function', .radialSVM)
	nm <- neldermead.set(nm, 'x0', x0)
	nm <- neldermead.set(nm, 'verbose', FALSE)
	nm <- neldermead.set(nm, 'storehistory', TRUE)
	nm <- neldermead.set(nm, 'verbosetermination', FALSE)
	nm <- neldermead.set(nm, 'method', "box")
	nm <- neldermead.set(nm, 'boundsmin', c(-15,-5))
	nm <- neldermead.set(nm, 'boundsmax', c(5,13))
 	nm <- neldermead.set(nm, 'boxnbpoints', 3)
	nm <- neldermead.set(nm, 'simplex0method', "randbounds")
	nm <- neldermead.set(nm, 'scalingsimplex0', "tocenter")
  
  # Execute (search)
	nm <- neldermead.search(nm)
	
	return(list(xopt = transpose(neldermead.get(nm, 'xopt'))))
}

Any scripts or data that you put into this service are public.

classyfire documentation built on May 29, 2017, 11:05 p.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

classyfire
Robust multivariate classification using highly optimised SVM ensembles

R/complex.R
In classyfire: Robust multivariate classification using highly optimised SVM ensembles

Defines functions boxRadial randSamples radialSVM complexFunc

Try the classyfire package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

classyfire Robust multivariate classification using highly optimised SVM ensembles

R/complex.R In classyfire: Robust multivariate classification using highly optimised SVM ensembles

Defines functions boxRadial randSamples radialSVM complexFunc

Try the classyfire package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

classyfire
Robust multivariate classification using highly optimised SVM ensembles

R/complex.R
In classyfire: Robust multivariate classification using highly optimised SVM ensembles