MBCbigP: Model-Based Clustering for High-Dimensional Data

#' @title Fit a mixture of multivariate Gaussians
#'
#' @description Fit a mixture of multivariate Gaussians
#'
#' @param x,x_A,x_B Data frame or a matrix
#' @param groups The number of groups/mixture components to fit.
#' @param maxiter The maximum number of iterations for the E-M algorithm.
#' @param likelihood Logical indicating whether the log-likelihood should be
#'   calculated at each step and returned (defaults to \code{TRUE}).
#' @param verbose Print verbose output if \code{TRUE}.
#' @param plot Visualise the mixture model as it progresses.
#' @param z A matrix of cluster probabilities.
#' @param mean_A Mean vectors for previous batch.
#' @param sigma_AA Covariance matrices for previous batch.
#' @param pro Mixing proportions.
#' @param abstol Stopping tolerance for likelihood.
#' @param method_sigma_AB One of \code{"analytic"} (default) or
#'   \code{"numeric"}, to choose the method of estimating the between-batch
#'   covariance for a cluster.
#' @param updateA Logical, if \code{TRUE}, updates the parameters for the
#'   previous batch after estimating the paramters for the current batch.
#'
#' @return A list containing the estimated parameters for the mixture
#'   distribution.
#'
#' @examples
#' library(mclust)
#' data(banknote)
#' mbc(x = banknote[, -1], groups = 2)

mbc <-
function (x, groups = 2, maxiter = 500, likelihood = TRUE, verbose = FALSE, plot
  = FALSE, z = NULL)
{
  x <- data.matrix(x)
  N <- nrow(x)
  p <- ncol(x)

  ## Initialise z matrix.

  if (is.null(z)){
    if (verbose)
      cat("\n  Initialising clusters...")
    z <- initialise.memberships(x, groups)
  }

  ## Initialise NULL log-likelihoods

  loglikprevious <- NULL
  loglik <- NULL

  if (verbose)
    cat("\n  Starting E-M iterations...")

  if (plot)
    plotobj <- plotmbc(x = x, parameters = NULL, z = z, groups = groups, p = p)

  for (times in 1:maxiter){

    ## Calculate maximum likelihood estimates for the mixing proportions, means
    ## and covariance matrices

    parameters <- mstep(x = x, z = z, groups = groups, p = p)

    if (plot)
      plotobj <- update.mbcplot(plotobj, parameters, z)

    ## Calculate log-likelihood.

    if (!is.null(loglik))
      loglikprevious <- loglik
    if (likelihood && (times %% 5 == 0)){
      loglik <- calcloglik(x = x, pro = parameters$pro, mean = parameters$mean,
        sigma = parameters$sigma, groups = parameters$groups)
    }

    ## If we have a previous log-likelihood, check that we are not decreasing
    ## the log-likelihood. If we are not increasing it by much, break the loop.

    if (!is.null(loglikprevious)){
      stopifnot(loglik >= loglikprevious)
      if (!(loglik > loglikprevious + (abs(loglikprevious) * 1e-7)))
        break
    }

    ## Calculate expected z values

    z <- estep(x = x, pro = parameters$pro, mean = parameters$mean, sigma =
      parameters$sigma, groups = parameters$groups)

    if (verbose && (times %% 5 == 0))
      cat("\n  Iteration ", times)
  }
  if (verbose)
    cat("\n")
  parameters$z <- z
  parameters$loglik <- loglik

  #if (plot)
  #  plotmbc(x = x, parameters = parameters, groups = groups, p = p)

  invisible(structure(parameters, class = "mbc"))
}

#'@rdname mbc

mbc_cond <- function(x_A, x_B, mean_A, sigma_AA, z, pro, groups, maxiter = 500,
  likelihood = TRUE, verbose = FALSE, plot = FALSE, abstol = 1e-3,
  method_sigma_AB = c("analytic", "numeric"), updateA = FALSE)
{
  method_sigma_AB <- match.arg(method_sigma_AB)
  loglik <- vector()

  for (times in 1:maxiter){

    if (verbose)
      cat("  Iteration ", times)

    parameters <- mstep_cond(x_B = x_B, x_A = x_A, z = z, mean_A = mean_A,
      sigma_AA = sigma_AA, sigma_AB = if (times == 1) NULL else parameters$cov,
      pro = if (times == 1) pro else parameters$pro, groups = groups,
      method_sigma_AB = method_sigma_AB)

    if (updateA){
      mean_A <- parameters$meanprev
      sigma_AA <- parameters$sigmaprev
    }

    if (likelihood){
      loglik[times] <- calcloglik_split(x_A = x_A, x_B = x_B, pro =
        parameters$pro, mean_A = mean_A, mean_B = parameters$mean,
        sigma_AA = sigma_AA, sigma_AB = parameters$cov, sigma_BB =
        parameters$sigma, groups = groups)
      if (verbose)
        cat("\tlog-likelihood:", loglik[times])
      if (likelihood && (times > 1L)){
        if ((loglik[times] - loglik[times - 1L]) < 0){
          #cat("\n")
          #stop("log-likelihood decreasing")
        }
      }
    }

    if (verbose)
      cat("\n")

    #z <- estep_cond(x_B = x_B, x_A = x_A, pro = parameters$pro, mean_A = mean_A,
    #  mean_B = parameters$mean, sigma_AA = sigma_AA, sigma_AB = parameters$cov,
    #  sigma_BB = parameters$sigma, groups = groups)

    z <- estep_cond(x_B = x_B, x_A = x_A, pro = parameters$pro, mean_A = mean_A,
      mean_B = parameters$mean, sigma_AA = sigma_AA, sigma_AB = parameters$cov,
      sigma_BB = parameters$sigma, groups = groups)#, oldz = attr(z, "unscaled"))

    if (plot){

      if (times == 1){
        plotobj <- plotmbcbigp(x_A = x_A, x_B = x_B, mean_A = mean_A, mean_B =
          parameters$mean, sigma_AA = sigma_AA, sigma_AB = parameters$cov,
          sigma_BB = parameters$sigma, z = z, groups = groups, p = NULL)
      } else {
        update.mbcbigpplot(plotobj, mean_A = mean_A, mean_B = parameters$mean,
          sigma_AA = sigma_AA, sigma_AB = parameters$cov, sigma_BB
          = parameters$sigma, z = z, groups = groups)
      }
      #par(mfrow = c(1, groups))
      #for (k in 1:groups){
      #  plot(z[, k], ylim = 0:1)
      #}
    }

    if (likelihood & (times > 1)){
      #if ((loglik[times] - loglik[times - 1L]) < -abstol)
      #  stop("log-likelihood decreasing")
      if (abs(diff(c(loglik[times], loglik[times - 1L]))) < abstol){
        if (verbose)
          cat("  Stopping: log-likelihood increase less than", abstol, "\n")
        break
      }
    }
  }
  invisible(structure(list(pro = parameters$pro, mean = parameters$mean,
    sigma = parameters$sigma, cov = parameters$cov, z = z, loglik = loglik),
    class = c("mbc_cond", "mbc")))
}