moosecounter: Adaptive Moose Surveys

## used to be called checkCompData
## x: MooseData
mc_check_data_comp <- function(x) {
  opts <- getOption("moose_options")
  x <- MooseData
  x_srv <- x[x$srv,]
  if (opts$response == "total") {
      x_srv$TOT_CALVES <- x_srv$COW_1C + 2*x_srv$COW_2C + x_srv$LONE_CALF
      x_srv$ADULT_COW <- x_srv$COW_1C + x_srv$COW_2C + x_srv$LONE_COW
      check <- x_srv$MOOSE_TOTA - (x_srv$BULL_LARGE + x_srv$BULL_SMALL +
        x_srv$ADULT_COW + x_srv$TOT_CALVES)
      problem <- sum(abs(check) > 0.001)
      if (problem > 0)
        stop(paste("Composition data do not equal", opts$Ntot, "for", problem, "cases"))
  } else {
      x_srv$TOT_CALVES <- x_srv$COW_1C + 2*x_srv$COW_2C + x_srv$LONE_CALF
      x_srv$ADULT_COW <- x_srv$COW_1C + x_srv$COW_2C + x_srv$LONE_COW
  }
    invisible(NULL)
}


## fit comp model for total
## used to be called fitCompModel
## x: MooseData
mc_fit_model_comp <- function(formula, x) {
  opts <- getOption("moose_options")
  keep <- x$UNKNOWN_AG == 0
  if (any(x$UNKNOWN_AG > 0))
      warning(paste0(sum(x$UNKNOWN_AG > 0),
        " rows with unknown animals excluded"))
  x <- x[keep,,drop=FALSE]

  x_srv <- x[x$srv,]
  x_srv <- x_srv[x_srv[[opts$Ntot]] > 0,]
  #X <- model.matrix(formula, x_srv)
  x_srv$TOT_CALVES <- x_srv$COW_1C + 2*x_srv$COW_2C + x_srv$LONE_CALF
  #      ADULT_COW <- x_srv$COW_1C + x_srv$COW_2C + x_srv$LONE_COW
  if (opts$response == "total") {
      ymat <- cbind(
        BULL_LARGE=x_srv$BULL_LARGE,
        BULL_SMALL=x_srv$BULL_SMALL,
        COW_1C=x_srv$COW_1C,
        COW_2C=x_srv$COW_2C,
        LONE_COW=x_srv$LONE_COW,
        TOT_CALVES=x_srv$TOT_CALVES)
  } else {
      ymat <- cbind(
        COW_1C=x_srv$COW_1C,
        COW_2C=x_srv$COW_2C,
        LONE_COW=x_srv$LONE_COW,
        TOT_CALVES=x_srv$TOT_CALVES)
      ymat[rowSums(ymat)==0,] <- NA
  }
  formula <- as.formula(paste("ymat", paste(as.character(formula), collapse=" ")))
  m <- vglm(formula=formula, data=x_srv, family=multinomial, na.action=na.omit)
  Nam <- names(m@coefficients)
  for (i in seq_len(ncol(ymat)-1L)) {
    j <- grepl(paste0(":", i), Nam)
    names(m@coefficients)[j] <- gsub(paste0(":", i),
      paste0(":", colnames(ymat)[i]), names(m@coefficients)[j])
  }
  m
}

#checkCompModelList <- function() {
#    if (!exists("CompModelList"))
#        assign("CompModelList", list(), envir=.GlobalEnv)
#    invisible(NULL)
#}

## used to be updateCompModelTab
mc_list_model_comp <- function(model_list_comp) {
  CompModelTab <- data.frame(AIC=sapply(model_list_comp, AIC))
  CompModelTab$delta <- CompModelTab$AIC - min(CompModelTab$AIC)
  rel <- exp(-0.5*CompModelTab$delta)
  CompModelTab$weight <- rel / sum(rel)
  CompModelTab <- data.frame(t(CompModelTab))
  #assign("CompModelTab", CompModelTab, envir=.GlobalEnv)
  t(CompModelTab)
}


#function(Survey.data, Unsurvey.data, B,
#moose.model, model.B, MAXCELL,
#Mult.model, alpha, TotalMMU.pred, MMU_ID)
## used to be MooseCompSimMMU.PI1
mc_pred_model_comp <- function(total_model_id, comp_model_id,
    model_list_comp, model_list_total, do_avg=FALSE) {

  opts <- getOption("moose_options")
  x <- MooseData
  ## if some survey area is defined, use dual prediction
  DUAL <- !is.null(opts$area_srv)
  if (DUAL) {
      eval(parse(text=paste0("x$area_srv <- x$", opts$area_srv)))
  } else {
      x$area_srv <- TRUE
  }

  keep <- x$UNKNOWN_AG == 0
  if (any(x$UNKNOWN_AG > 0))
      warning(sum(x$UNKNOWN_AG > 0),
        " rows with unknown animals excluded")
  x <- x[keep,,drop=FALSE]

  x$sort_id <- 1:nrow(x)
  srv <- x$srv
  Survey.data <- x[srv,]
  if (opts$response != "total") {
    Survey.data$BULL_LARGE[] <- 0
    Survey.data$BULL_SMALL[] <- 0
  }

  Survey.data$TOT_CALVES <- Survey.data$COW_1C +
    2*Survey.data$COW_2C + Survey.data$LONE_CALF
  Unsurvey.data <- x[!srv,]

  B <- opts$B
  mid <- character(B)
  alpha <- opts$alpha
  MAXCELL <- if (is.null(opts$MAXCELL))
      2*max(x[srv,opts$Ntot], na.rm=TRUE) else opts$MAXCELL
  if (MAXCELL < max(x[srv,opts$Ntot], na.rm=TRUE))
      stop("MAXCELL must not be smaller than max observed total abundance")

  if (!all(total_model_id %in% names(model_list_total)))
      stop(paste0(total_model_id, " model cannot be found"))
  #wt <- updateModelTab()
  wt <- mc_list_model_total(model_list_total)
  wts <- wt[total_model_id,,drop=FALSE]
  total_model_id0 <- total_model_id
  #total_fit <- ModelList[[total_model_id]]

  if (!(comp_model_id %in% names(model_list_comp)))
    stop(paste(comp_model_id, " model cannot be found"))
  Mult.model <- model_list_comp[[comp_model_id]]

## ??? Total.pred should be recalculated inside the loop ???
#  pr_uns <- predict(total_fit, newdata=x[subset_uns,,drop=FALSE], type=c("response"))
#  Total.pred <- sum(pr_uns) + sum(Survey.data$MOOSE_TOTA[subset_srv])

  #  Total.pred <- TotalMMU.pred
  #  Unsurvey.data <- subset(Unsurvey.data[Unsurvey.data$MMU == MMU_ID])
  ## sum observed + predicted

#  parms.start <- list(
#    count = total_fit$coef$count,
#    zero = total_fit$coef$zero,
#    theta = total_fit$theta)

  BUnsurvey.data <- Unsurvey.data
  NS <- nrow(BUnsurvey.data)

  tmp <- matrix(0, nrow(x), B)
  all_ratios_list <- list(
    Total.pred = tmp,
    Total_LB =  tmp,
    Total_Calves = tmp,
    Total_Cows = tmp,
    Total_SB = tmp,
    Total_Yrlings = tmp,
    Total_Mature_Cows = tmp,
    Total_1C = tmp,
    Total_2C = tmp)

  b <- 1
  pb <- startpb(0, B)
  on.exit(closepb(pb))

  ISSUES <- list()

  while (b <= B) {

  index <- sample(seq(1:nrow(Survey.data)), nrow(Survey.data), replace=TRUE)
  BSurvey.data <- Survey.data[index,]
  if (max(BSurvey.data$MOOSE_TOTA) != 0) { # loop 1


    ## model selection
    if (do_avg) {
        total_model_id <- sample(rownames(wts), 1, prob=wts$weight)
    } else {
        total_model_id <- rownames(wts)[which.max(wts$weight)]
        if (length(total_model_id) > 1) # this should really never happen
            total_model_id <- sample(total_model_id, 1)
    }
    mid[b] <- total_model_id
    total_fit <- model_list_total[[total_model_id]]
    parms.start <- list(
        count = total_fit$coef$count,
        zero = total_fit$coef$zero,
        theta = total_fit$theta)
    w <- rep(1, nrow(BSurvey.data))
    model.Boot <- try(suppressWarnings(update(total_fit,
      data = BSurvey.data,
      control = zeroinfl.control(
        start = parms.start,
        method = opts$method))), silent = TRUE)
    if (!inherits(model.Boot, "try-error")) {
        attr(model.Boot, "parms.start") <- parms.start
        if (inherits(total_fit, "wzi"))
          model.Boot <- wzi(model.Boot, pass_data=TRUE)

    #   model.Boot <- model.B(BSurvey.data)
        predict.BNS <- predict(model.Boot, newdata=Unsurvey.data, type="response")
        predict.BNSout <- if (DUAL && inherits(total_fit, "wzi")) {
            predict(model.Boot$unweighted_model,
                newdata=Unsurvey.data, type="response")
        } else {
            predict.BNS
        }

        if (max(predict.BNS, predict.BNSout) <= MAXCELL & model.Boot$optim$convergence == 0) { # loop 2
          ## here 'count' refers to the abundance model (no ZI considered)
          Bm.NS <- predict(model.Boot, newdata=Unsurvey.data, type="count")
          Btheta.nb <- model.Boot$theta
          #Bphi.zi <- 1 - plogis(coef(model.Boot)[length(coef(model.Boot))])
          Bphi.zi <- 1 - predict(model.Boot, newdata=Unsurvey.data, type="zero")
          PUnsurvey.data <- rZINB(NS, mu.nb=Bm.NS,
            theta.nb=Btheta.nb, phi.zi=Bphi.zi)
          if (DUAL && inherits(total_fit, "wzi")) {
            Bm.NSout <- predict(model.Boot$unweighted_model,
                newdata = Unsurvey.data[!Unsurvey.data$area_srv,], type="count")
            Btheta.nbout <- model.Boot$unweighted_model$theta
            Bphi.ziout <- 1 - predict(model.Boot$unweighted_model,
                newdata = Unsurvey.data[!Unsurvey.data$area_srv,], type="zero")
            PUnsurvey.data[!Unsurvey.data$area_srv] <- rZINB(sum(!Unsurvey.data$area_srv),
                mu.nb = Bm.NSout,
                theta.nb=Btheta.nbout,
                phi.zi=Bphi.ziout)
          }

          if (max(PUnsurvey.data) <= MAXCELL) { # loop 3
            BUnsurvey.data$MOOSE_TOTA <- PUnsurvey.data
            newdata1 <- BUnsurvey.data[BUnsurvey.data$MOOSE_TOTA != 0,]
            NS1 <- nrow(newdata1)

            pred.prob <- predict(Mult.model, newdata=newdata1, type="response")
            K <- ncol(pred.prob)

            pred.numbers1 <- matrix(-100,NS1,K)

            for (i in 1:NS1){
      	       pred.numbers1[i,] <- rmultinom(1, newdata1$MOOSE_TOTA[i], pred.prob[i,])
             }

            pred.numbers <- matrix(0,NS,K)
            pred.numbers[BUnsurvey.data$MOOSE_TOTA != 0,] <- pred.numbers1
            if (opts$response == "total") {
                pred.numbers <- data.frame(
                  BULL_LARGE = pred.numbers[,1],
                  BULL_SMALL = pred.numbers[,2],
                  COW_1C = pred.numbers[,3],
                  COW_2C = pred.numbers[,4],
                  LONE_COW = pred.numbers[,5],
                  TOT_CALVES = pred.numbers[,6])
            } else {
                pred.numbers <- data.frame(
                  BULL_LARGE = 0,
                  BULL_SMALL = 0,
                  COW_1C = pred.numbers[,1],
                  COW_2C = pred.numbers[,2],
                  LONE_COW = pred.numbers[,3],
                  TOT_CALVES = pred.numbers[,4])
            }

            all_ratios_list$Total.pred[,b] <- c(Survey.data$MOOSE_TOTA,
                rowSums(pred.numbers))
            all_ratios_list$Total_LB[,b] <- c(Survey.data$BULL_LARGE,
                pred.numbers$BULL_LARGE)
            all_ratios_list$Total_Calves[,b] <- c(Survey.data$TOT_CALVES,
                pred.numbers$TOT_CALVES)
            all_ratios_list$Total_Cows[,b] <- c(
                Survey.data$COW_1C +
                Survey.data$COW_2C +
                Survey.data$LONE_COW,
                pred.numbers$COW_1C + pred.numbers$COW_2C + pred.numbers$LONE_COW)
            all_ratios_list$Total_SB[,b] <- c(Survey.data$BULL_SMALL,
                pred.numbers$BULL_SMALL)
            all_ratios_list$Total_Yrlings[,b] <- 2 * all_ratios_list$Total_SB[,b]
            all_ratios_list$Total_Mature_Cows[,b] <-
                all_ratios_list$Total_Cows[,b] - all_ratios_list$Total_SB[,b]
            all_ratios_list$Total_1C[,b] <- c(Survey.data$COW_1C,
                pred.numbers$COW_1C)
            all_ratios_list$Total_2C[,b] <- c(Survey.data$COW_2C,
                pred.numbers$COW_2C)

          setpb(pb, b)
            b <- b + 1
          } # loop 3
        } # loop 2
    } else { # if
      ISSUES[[length(ISSUES)+1]] <- as.character(model.Boot)
    } # if
  } # loop 1
  } # while

    o <- order(c(Survey.data$sort_id, Unsurvey.data$sort_id))
    for (i in 1:length(all_ratios_list))
        all_ratios_list[[i]] <- all_ratios_list[[i]][o,,drop=FALSE]
    sc <- summarize_composition(all_ratios_list)
    out <- list(total_model_id=total_model_id0,
        comp_model_id=comp_model_id,
        do_avg=do_avg,
        total_model_select_id=mid,
        alpha=alpha,
        boot_full=all_ratios_list,
        issues=ISSUES,
        data=x,
        cells=sc$cells,
        total=sc$total)
    out
}

## OK--need to summarize the whole stuff as array at cell level (n x vars x B)
## write a subset function and calculate the totals based on that
## keep cell min restriction there
## remove subset option from CPI dialogue
## add CPI subset dialog (similar to PI subset)
# used to be summarize_composition
mc_summarize_composition <- function(all_ratios_list) {
    opts <- getOption("moose_options")
    alpha <- opts$alpha
    dc <- lapply(all_ratios_list, function(z)
        t(apply(z, 1, quantile, c(alpha/2,0.5,(1-alpha/2)))))
    dcell <- do.call(cbind, dc)
    colnames(dcell) <- paste(rep(names(dc), each=3), colnames(dc[[1]]), sep="_")
    d <- sapply(all_ratios_list, colSums)
    d <- data.frame(d)
  ## Now we will compute the required ratios.
  ## They will be returned when the function is run.
    ## Number of calves per 100 cows
    d$CC.ratio <- (d$Total_Calves/d$Total_Mature_Cows)*100
    d$YC.ratio <- (d$Total_Yrlings/d$Total_Mature_Cows)*100
    ## Number of large bulls per 100 cows
    d$BC.ratio <- (d$Total_LB/d$Total_Mature_Cows)*100
    d$PC_BULL_LARGE <- d$Total_LB/d$Total.pred
    d$PC_COWS_MATURE <- d$Total_Mature_Cows/d$Total.pred
    d$PC_Yrlings <- d$Total_Yrlings/d$Total.pred
    d$PC_Calves <- d$Total_Calves/d$Total.pred
    d$Yrling_Recruitment <- d$Total_Yrlings/(d$Total.pred - d$Total_Calves)
    d$Twining_rate <- d$Total_2C/(d$Total_1C + d$Total_2C)
    dtot <- t(apply(d, 2, quantile, c(alpha/2,0.5,(1-alpha/2))))
    list(total=dtot, cells=dcell, raw=d)
}

saveCpiData <- function(CPI) {
  tmp <- CPI$cells[!CPI$data$srv,,drop=FALSE]
  assign("CpiData", tmp, envir=.GlobalEnv)
    invisible(NULL)
}

## this is used for subset, to avoid confusion
saveCpiDataSubset <- function(CPI) {
  tmp <- CPI$cells[!CPI$data$srv,,drop=FALSE]
  assign("CpiDataSubset", tmp, envir=.GlobalEnv)
    invisible(NULL)
}

subsetCpiData <- function(CPI, ss) {
    if (missing(ss))
        ss <- rep(TRUE, nrow(CPI$data))
    opts <- getOption("moose_options")
    CPIout <- CPI
    for (i in 1:length(CPI$boot_full))
        CPIout$boot_full[[i]] <- CPI$boot_full[[i]][ss,,drop=FALSE]
    CPIout$total <- summarize_composition(CPIout$boot_full)$total
    CPIout$cells <- CPI$cells[ss,,drop=FALSE]
    CPIout$data <- CPI$data[ss,,drop=FALSE]

    if (nrow(CPIout$data) < opts$MINCELL)
        stop(paste0("Composition PIs cannot be provided for <",
            opts$MINCELL, " cells"))
    CPIout
}

pred_density_moose_CPI <- function(CPI, ...){
    out <- round(CPI$total, 2)
    cat("Composition PI summary:\n\n")
    print(out, ...)
    if (length(CPI$issues) > 0L) {
        cat("\nNote:", length(CPI$issues),
            "issues were found during CPI calculations.\n\n")
    }
    invisible(out)
}

plotComp <-
function(NAME) {
    formula <- as.formula(paste("~", NAME))
    m <- fitCompModel(formula)
    mf <- model.frame(m)
    pr0 <- fitted(m)
    x <- mf[,NAME]

    col <- c("#7fc97f","#beaed4","#fdc086","#ffff99","#386cb0","#f0027f")
    if (is.numeric(MooseData[,NAME])) {
        i <- order(x)
        x <- x[i]
        pr0 <- pr0[i,]
        pr <- t(apply(pr0, 1, cumsum))
        op <- par(mfrow=c(1,3), las=1)
        pr2 <- cbind(0, pr)
        matplot(x, 100*pr2, type="l", lty=1, main="Composition", xlab=NAME,
            ylab="Percent of Total", col=col, axes=FALSE)
        axis(1)
        axis(2)
        for (i in 1:6) {
            polygon(c(x, rev(x)), 100*c(pr2[,i], rev(pr2[,i+1])), col=col[i])
        }
        matplot(x, 100*pr[,1:5], type="l", lty=1, col=1, add=TRUE)

        matplot(x, 100*pr0, type="l", lty=1, lwd=3, main="", xlab=NAME,
            ylab="Percent of Total", col=col, ylim=c(0,100*max(pr0)))

        plot.new()
        legend("topleft", fill=rev(col), legend=rev(colnames(mf$ymat)))
        par(op)
    } else {
        i <- !duplicated(x)
        x <- x[i]
        pr0 <- t(pr0[i,])
        colnames(pr0) <- as.character(x)
        op <- par(mfrow=c(1,3), las=1)
        barplot(100*pr0, space=0, names.arg=x, main="Composition", xlab=NAME,
            ylab="Percent of Total",col=col)

        matplot(1:ncol(pr0), 100*t(pr0), type="b", lty=2, lwd=3, main="",
            xlab=NAME, axes=FALSE, pch=19, xlim=c(0.5, ncol(pr0)+0.5),
            ylab="Percent of Total", col=col, ylim=c(0,100*max(pr0)))
        axis(1, at=1:ncol(pr0), labels=colnames(pr0))
        axis(2)
        graphics::box()

        plot.new()
        legend("topleft", fill=rev(col), legend=rev(colnames(mf$ymat)))
        par(op)
    }
    invisible(NULL)
}