qzmle: Maximum likelihood estimation

Documented in add_logl mkfun

## List of log-lik function for different distributions
loglik_list <- list(
  dbinom = list(
    expr = expression(log(size) + x * log(prob) + (size - x) * log((1 - prob))),
    params = c("prob")
  ),
  dpois = list(
    expr = expression(x * log(lambda) - lambda - lfactorial(x)),
    params = c("lambda")
  ),
  dnorm = list(
    expr = expression(
      -log((2 * pi)^0.5)
      - log(sd)
        - (x - mean)^2 / (2 * sd^2)
    ),
    params = c("mean", "sd")
    ),
  dnbinom = list(
    ## gamma(x+size)/ (gamma(size)*factorial(x)) * prob^size * (1-prob)^x
    ## prob = size/(size + mu)
    expr = expression(lgamma(x + size) - lgamma(size) - lfactorial(x) +
                        size*(log(size) - log(size+mu)) +
                        x*(log(mu) - log(size+mu))),
    params = c("mu", "size"))
)

#' Allow users to add their own log likelihood functions
#' @name add_logl
#' @param funct objective function (must be defined in environment)
#' @param logl log likelihood function as expression
#' @param params a vector of parameters for the objective function
#' @export
add_logl <- function(funct, logl, params) {
  if (try(check_fun(funct))) {
    funct_name <- as.character(substitute(funct))
    new_funct <- list(expr = logl, params = params)
    new_list <- list(new_funct)
    names(new_list) <- funct_name
    loglik_list <- c(loglik_list, new_list)
  }
}

#' Deriving the log-lik and gradients
#' @name mkfun
#' @param formula A formula in expression form of "y ~ model"
#' @param data A list of parameter in the formula with values in vectors
#' @param links Link function for each parameters
#' @param parameters A list of linear submodels
#' @param start A list of start values for formula parameters
#' @examples
#' set.seed(101)
#' dd <- data.frame(y = rpois(100, lambda = 1))
#' fun1 <- mkfun(y ~ dpois(exp(lambda)), start = list(lambda = 0), data = dd)
#' fun2 <- mkfun(y ~ dnorm(mean = b0 + b1 * latitude^2, sd = 1),start = list(lambda = 0), data = dd)
#' rfp <- transform(emdbook::ReedfrogPred, nsize = as.numeric(size), random = rnorm(48))
#' form <- surv ~ dbinom(size = density, prob = exp(log_a) / (1 + exp(log_a) * h * density))
#' fun3 <- mkfun(form, start = list(h = 1, log_a = 0),
#'                 parameters = list(log_a ~ poly(nsize)), data = rfp)
#' fun4 <- mkfun(form, start = list(h = 4, log_a = 2),
#'                 parameters = list(log_a ~ poly(random)), data = rfp)
#' @importFrom utils relist
#' @export

#' @importFrom Deriv Deriv
mkfun <- function(formula, start,
                  links = NULL,
                  parameters = NULL,
                  data) {
  if (missing(data)) {
    stop("missing `data` argument...function does not use data from local environment") # if no data
  }

  response <- formula[[2]]
  ddistn <- as.character(RHS(formula)[[1]])

  ## Check distribution
  ## suggest to add user's own likelihood function
  cf <- try(check_fun(ddistn), silent = TRUE)
  if (inherits(cf, "try-error")) {
    if (!ddistn %in% names(loglik_list)) {
      stop(
        "Can't evaluate the likelihood for ", sQuote(ddistn),
        paste("\n Use add_logl() to add the log likelihood function")
      )
    }
  }

  ## submodels
  if (!is.null(parameters)) {
    ## setting up submodels
    submodel_vars <- vapply(parameters, LHS_to_char, FUN.VALUE = character(1))
    parameters <- sapply(parameters, "[", -2)
    Xlist <- lapply(parameters, parameter_parse, data = data)
    names(Xlist) <- submodel_vars
    ## make sure start values of parameters in the same order as the Xlist
    pvec <- start[submodel_vars]
  } else {
    submodel_vars <- NULL
    pvec <- NULL
  }

  ## if missing arguments, use the named argument as the first element,
  ## all other elements of the sub-model parameter vector are 0
  for (i in submodel_vars) {
    n_missed <- ncol(Xlist[[i]]) - length(pvec[[i]])
    if (n_missed < 0) stop("Too many argments in start for parameter: ", sQuote(i))
    if (n_missed != 0) pvec[[i]] <- c(pvec[[i]], rep(0, n_missed))
    ## add sub model parameter names
    names(pvec[[i]]) <- colnames(Xlist[[i]])
  }

  ## add parameters with no submodels
  start <- c(pvec, start[!names(start) %in% names(pvec)])

  ## assign distribution parameters
  mnames <- loglik_list[[ddistn]]$params
  arglist <- as.list(RHS(formula)[-1]) ## $lambda = (b0 * latitude^2), sd///delete function name

  ## FIXME: might break something
  if (is.null(submodel_vars)) {
    names(arglist) <- mnames
  }

  arglist1 <- c(list(x = response), arglist, list(log = TRUE))


  fn <- function(pars) {
  pars <- relist(pars, start)

    if (!is.null(submodel_vars)) {
      for (par in names(pars)) {
        if (par %in% submodel_vars) {
          pars[[par]] <- c(Xlist[[par]] %*% pars[[par]])
        }
      }
    }

    pars_and_data <- c(as.list(pars), data)
    r <- with(pars_and_data, -sum(do.call(ddistn, arglist1)))
    return(r)
  }


  gr <- function(pars) {
    pars <- relist(pars, start)

    if (!is.null(submodel_vars)) {
      for (par in names(pars)) {
        if (par %in% submodel_vars) {
          pars[[par]] <- c(Xlist[[par]] %*% pars[[par]])
        }
      }
    }

    pars_and_data <- c(as.list(pars), data)

    ## eventually we need to calculate partial derivatives of the log-likelihood
    ## with respect to all of its parameters
    LL <- loglik_list[[ddistn]]$expr
    d0 <- Deriv::Deriv(LL, mnames) ## d(dist)/d(mnames)
    arglist_eval <- lapply(arglist, eval, pars_and_data) ## mean, sd
    arglist_eval$x <- eval(response, pars_and_data) ## evaluate response variable and assign its value to 'x'
    d1 <- eval(d0, arglist_eval) ## sub d0 - compute the deriv of log_lik wrt to its parameters
    ## d1 = D(dbinom/prob)

    ## parameters of model parameter
    parnames <- setdiff(all.vars(RHS(formula)), names(data))

    glist <- list()
    ## a matrix with appropriately named columns corresponding to parameters
    ## we  know what the structure of the returned gradient vector (which
    ## constitutes the gradients for all observations squashed together,
    ## i.e.  g_11, g_12,... g_21,g_22,... g_ij
    ##  where i indicates the parameter and j indicates the observation
    ## uses the fact that R stores matrix in column-major order
    d1_mat <- matrix(d1, ncol = length(mnames), dimnames = list(NULL, mnames))
    for (m in mnames) {
      d2 <- d1_mat[, m]
      if (is.numeric(arglist[[m]])) {
        ## constant!
        glist[[m]] <- 0
      } else {
        for (p in parnames) {
          if (p %in% all.vars(arglist[[m]])) {
            ## links
            # tlink <- links[[p]]
            # mm <- make.link(tlink)

            dlist <- list()
            ## d(mean)/d(b0); d(prob)/d(log_a)
            dlist[[m]][[p]] <- eval(Deriv::Deriv(arglist[[m]], p), pars_and_data)

            ## check if parameter has submodel
            if (p %in% submodel_vars) {
              ## change into Xlist[[param]] into a list
              dvars <- split(Xlist[[p]], rep(1:ncol(Xlist[[p]]),
                each = nrow(Xlist[[p]])
              ))
              names(dvars) <- paste(p, colnames(Xlist[[p]]), sep = ".")

              for (i in names(dvars)) {
                ## d(log_a)/d(log_a.intercept)
                d3 <- dvars[[i]]
                glist[[m]][[i]] <- -sum(d3 * d2 * dlist[[m]][[p]])
              }
            } else {
              # deriv rule on links - d(b0)/d(log_b0)
              ## dlist[[m]][[p]] <- 1/mm$mu.eta(mm$linkinv(dlist[[m]][[p]]))
              glist[[m]][[p]] <- -sum(d2 * dlist[[m]][[p]])
            }
          }
        } ## p in parnames
      } ## arg is not constant
    } ## m in mnames
    return(unlist(glist))

    ## sd - d(loglik_norm)/d(sd) * d(sd)/d(log_sd)
    ## b0 - d(loglik_norm)/d(norm) * d(mean)/d(b0) * d(b0)/d(log(b0))
    ## b1 - d(loglik_norm)/d(norm) * d(mean)/d(b1)

    ## d(loglik_pois/d(lambda))* d(lambda)/d(b0)
  }
  return(list(start = start, fn = fn, gr = gr))
}