RadiologyFeatureExtraction: Feature Extraction for Radiology data

Documented in fit2DConvAutoencoder fitVanillaAutoencoder

# Copyright 2018 Observational Health Data Sciences and Informatics
#
# This file is part of RadiologyFeatureExtraction
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

####Fit Vanilla autoencoder####
#' Fit Vanilla autoencoder
#' 
#' 
#' @export
fitVanillaAutoencoder <- function(trainData,
                                  valProp,
                                  epochs = epochs,
                                  batchSize = batchSize,
                                  latentDim = latentDim,
                                  optimizer = 'adadelta', 
                                  loss = 'binary_crossentropy',
                                  imageProcessingSettings = imageProcessingSettings){
    K <- keras::backend()
    startTime <- Sys.time()
    #early stopping
    earlyStopping <- keras::callback_early_stopping(monitor = "val_loss", patience = 10, mode = "auto", min_delta = 1e-2)
    
    originalDim <- c(length(imageProcessingSettings$roiWidth)*length(imageProcessingSettings$roiHeight))
    
    # Splitting train and validation
    if(valProp==0){
        valData<-trainData
    } else {
        valInd<-sample(nrow(trainData) ,round(valProp*nrow(trainData),0 ))
        
        valData <- trainData[valInd,]
        trainData <- trainData [-valInd,]
    }
    
    
    # Model definition --------------------------------------------------------
    input_layer <- keras::layer_input(shape = originalDim)
    # "encoded" is the encoded representation of the input
    encoded<- input_layer %>% 
        keras::layer_dense(latentDim , activation = "relu")
    # "decoded" is the lossy reconstruction of the input
    decoded<- encoded %>% 
        keras::layer_dense(originalDim , activation = "sigmoid")
    
    # this model maps an input to its reconstruction
    autoencoder <- keras::keras_model(input_layer, decoded)
    #Let's also create a separate encoder model:
    # this model maps an input to its encoded representation
    encoder <- keras::keras_model(input_layer, encoded)
    
    #As well as the decoder model:
    # create a placeholder for an encoded (with latent dimension) input
    encodedInput <- keras::layer_input(shape = c(latentDim))
    
    # retrieve the last layer of the autoencoder model
    #decoderLayer = keras::get_layer(autoencoder,index=-1)
    # create the decoder model
    #decoder <- keras::keras_model(encodedInput, decoderLayer(encodedInput))
    
    autoencoder  %>% compile(optimizer = optimizer, loss = loss)
    
    history<-autoencoder %>% fit (trainData, trainData,
                                  epochs=epochs,
                                  batchSize=batchSize,
                                  shuffle=TRUE,
                                  validation_data=list(valData, valData),
                                  #validation_split = vaeValidationSplit,
                                  callbacks = list(earlyStopping))
    
    encoderModel<-list(encoderModel = autoencoder,
                       encoder = encoder,
                       history = history#,
                       #decoder = decoder
                       )
    
    class(encoderModel) <- "encoderModel"
    delta <- Sys.time() - startTime
    print(delta)
    return(encoderModel)
}

####Fit 2-dimension convolutional autoencoder####
#' Fit 2-dimensional autoencoder
#' 
#' 
#' @export
fit2DConvAutoencoder <- function(trainData,
                                 valProp,
                                 epochs = epochs,
                                 batchSize = batchSize,
                                 poolingLayerNum = poolingLayerNum,
                                 kernelSize = kernelSize,
                                 poolSize = poolSize,
                                 optimizer = 'adadelta', 
                                 loss = 'binary_crossentropy',
                                 imageProcessingSettings = imageProcessingSettings){
    K <- keras::backend()
    startTime <- Sys.time()
    #early stopping
    earlyStopping <- keras::callback_early_stopping(monitor = "val_loss", patience = 10, mode = "auto", min_delta = 1e-2)
    
    originalDim <- c(length(imageProcessingSettings$roiWidth),length(imageProcessingSettings$roiHeight),1)
    latentDim <- c( (length(imageProcessingSettings$roiWidth) / (poolSize^poolingLayerNum)), (length(imageProcessingSettings$roiHeight) / (poolSize^poolingLayerNum)))
    
    # Splitting train and validation
    if(valProp==0){
        valData<-trainData
    } else {
        valInd<-sample(nrow(trainData) ,round(valProp*nrow(trainData),0 ))
        
        valData <- trainData[valInd,,,]
        trainData <- trainData [-valInd,,,]
    }
    
    #add dimension for channel
    if( length(dim(trainData))<=3){
        dim(trainData)<-c(dim(trainData),1)
    }
    if( length(dim(valData))<=3){
        dim(valData)<-c(dim(valData),1)
    }

    ##output calculator #outputDim = (originalDim-filterSize+2*paddingSize)/stride + 1
    ##define the model
    # input_layer <- 
    #     keras::layer_input(shape = originalDim) 
    # 
    # encoded<-
    #     input_layer %>%
    #     layer_conv_2d(filters = 16, kernel_size = c(3,3), activation = 'relu',padding='same')%>% 
    #     layer_max_pooling_2d(pool_size = c(poolSize, poolSize),padding='same')%>% 
    #     layer_conv_2d(filters = 8, kernel_size = c(3,3), activation = 'relu',padding='same')%>% 
    #     layer_max_pooling_2d(pool_size = c(poolSize, poolSize),padding='same')%>% 
    #     layer_conv_2d(filters = 8, kernel_size = c(3,3), activation = 'relu',padding='same')%>% 
    #     layer_max_pooling_2d(pool_size = c(poolSize, poolSize),padding='same')
    # 
    # decoded <-
    #     encoded %>%
    #     layer_conv_2d(filters = 8, kernel_size = c(3,3), activation = 'relu',padding='same')%>% 
    #     layer_upsampling_2d(size = c(poolSize, poolSize))%>%
    #     layer_conv_2d(filters = 8, kernel_size = c(3,3), activation = 'relu',padding='same')%>% 
    #     layer_upsampling_2d(size = c(poolSize, poolSize))%>%
    #     layer_conv_2d(filters = 16, kernel_size = c(3,3), activation = 'relu',padding='same')%>% 
    #     layer_upsampling_2d(size = c(poolSize, poolSize))%>%
    #     layer_conv_2d(filters = 1, kernel_size = c(3,3), activation = 'sigmoid',padding='same') 
    ## this model maps an input to its reconstruction
    #autoencoder <- keras::keras_model(input_layer, decoded)
    ##Let's also create a separate encoder model:
    # this model maps an input to its encoded representation
    #encoder <- keras::keras_model(input_layer, encoded)
    ##As well as the decoder model:
    ## create a placeholder for an encoded (with latent dimension) input
    #encodedInput <- keras::layer_input(shape = c(latentDim))
    ## retrieve the last layer of the autoencoder model
    #decoderLayer = keras::get_layer(autoencoder,index=-1)
    ## create the decoder model
    #decoder <- keras::keras_model(encodedInput, decoderLayer(encodedInput))
        
    #define the model
    encoder <- keras::keras_model_sequential()
    encoder %>% layer_conv_2d(input_shape = originalDim, filters = 16, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same')
    encoder %>% layer_max_pooling_2d(pool_size = c(poolSize, poolSize),padding='same') 
    encoder %>% layer_conv_2d(filters = 8, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same') 
    encoder %>% layer_max_pooling_2d(pool_size = c(poolSize, poolSize),padding='same')
    encoder %>% layer_conv_2d(filters = 8, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same') 
    encoder %>% layer_max_pooling_2d(pool_size = c(poolSize, poolSize),padding='same')
    if (poolingLayerNum >= 4) {encoder %>% 
        layer_conv_2d(filters = 8, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same') %>% 
        layer_max_pooling_2d(pool_size = c(poolSize, poolSize),padding='same')}
    if (poolingLayerNum == 5) {encoder %>% 
            layer_conv_2d(filters = 8, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same') %>% 
            layer_max_pooling_2d(pool_size = c(poolSize, poolSize),padding='same')}
    
    autoencoder <- encoder
    if (poolingLayerNum == 5) {autoencoder %>% 
            layer_conv_2d(filters = 8, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same') %>% 
            layer_upsampling_2d(size = c(poolSize, poolSize))}
    if (poolingLayerNum >= 4) {autoencoder %>% 
            layer_conv_2d(filters = 8, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same') %>% 
            layer_upsampling_2d(size = c(poolSize, poolSize))}
    autoencoder %>% layer_conv_2d(filters = 8, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same')
    autoencoder %>% layer_upsampling_2d(size = c(poolSize, poolSize))
    autoencoder %>% layer_conv_2d(filters = 8, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same')
    autoencoder %>% layer_upsampling_2d(size = c(poolSize, poolSize))
    autoencoder %>% layer_conv_2d(filters = 16, kernel_size = c(kernelSize,kernelSize), activation = 'relu',padding='same')
    autoencoder %>% layer_upsampling_2d(size = c(poolSize, poolSize))
    autoencoder %>% layer_conv_2d(filters = 1, kernel_size = c(kernelSize,kernelSize), activation = 'sigmoid',padding='same') 
    
    summary(autoencoder)
    
    #compile
    autoencoder  %>% compile(optimizer = optimizer, loss = loss)
    
    #fit
    history<-autoencoder %>% fit (trainData, trainData,
                                  epochs=epochs,
                                  batchSize=batchSize,
                                  shuffle=TRUE,
                                  validation_data=list(valData, valData),
                                  #validation_split = vaeValidationSplit,
                                  callbacks = list(earlyStopping))
    
    encoderModel<-list(encoderModel = autoencoder,
                       encoder = encoder,
                       history = history,
                       latentDim = latentDim#,
                       #decoder = decoder
    )
}