gadgetutils: Tools to create and maintain gadget3 models

Documented in g3_fit

#' Build output summary suitable for feeding into gadgetplots
#'
#' @param model A G3 model built using \code{\link[gadget3]{g3_to_r}} or \code{\link[gadget3]{g3_to_tmb}}. The model must include \code{\link[gadget3]{g3a_report_detail}}.
#' @param params The fitted parameters post-optimisation
#' @param rec.steps Which steps should be considered recruitment steps? Vector of int, or NULL for all steps.
#' @param steps Which steps to include in the annual output? Vector of int.
#' @param printatstart Should the stock standard be printed at the start of the timestep (1) or the end (0)
#' @return List of tibbles
#' @export
g3_fit <- function(model, 
                   params, 
                   rec.steps = 1, 
                   steps = 1,
                   printatstart = 1){
  
  ## Checks
  stopifnot(is.list(params))
  if (!(printatstart %in% c(0,1))){
    stop("The printatstart argument must be '0' or '1' (class numeric)")
  }
  
  ## Returning parameters as they are put in for now
  ## so model(fit$params) will work without any fiddling
  out_params <- params
  
  if (inherits(model, "g3_r")) {
      if (inherits(params, 'data.frame')){
        params <- params$value
      }
      if ("report_detail" %in% names(params) && printatstart == 1) {
          params$report_detail <- 1L
          model_output <- model(params)
          tmp <- attributes(model_output)
      } else {
          tmp <- NULL
      }
  } else if (inherits(model, "g3_cpp")) {
      if (is.data.frame(params) && "report_detail" %in% params$switch && printatstart == 1) {
          params['report_detail', 'value'] <- 1L
          tmp <- gadget3::g3_tmb_adfun(model, params)$report(gadget3::g3_tmb_par(params))
      } else {
          tmp <- NULL
      }
  } else {
      stop("Unknown model type: ", class(model))
  }

  # If model is missing actions, then add them and try again
  if (is.null(tmp)) {
    
    ## Incorporate reporting action
    re_actions <- c(attr(model, 'actions'),
                    list(gadget3::g3a_report_detail(attr(model, 'actions'))))
    
    ## Mortality and harvest rates are calculated from the stock info. (biomass/numbers)
    ## at the beginning of the timestep and the numbers/biomass consumed in the timestep
    ## Therefore if we want to print the stock info. at the end of the timestep
    ## this needs to be in addition to, rather than instead of, the reporting
    ## at the begging of the timestep
    
    ## Solution is to calculate mortality within gadget3 rather than from the 
    ## reported output from gadget3
    
    if (printatstart == 0){
      re_actions <- c(re_actions,
                      list(gadget3::g3a_report_history(attr(model, 'actions'), 
                                                       var_re = c('__num$', '__wgt$'),
                                                       out_prefix = 'endprint_',
                                                       run_at = 11)))
    }
    
    ## Compile model
    model <- gadget3::g3_to_r(re_actions)
    
    ## Run model
    if (is.data.frame(params)) params <- params$value
    params$report_detail <- 1L
    model_output <- model(params)
    tmp <- attributes(model_output)
  }
  
  
  
  ## Calculate the step size as a proportion
  step_lengths <- tmp$step_lengths
  if (is.null(step_lengths)) {
      model_f <- gadget3:::f_concatenate(gadget3:::g3_collate(attr(model, 'actions')))
      step_lengths <- get('step_lengths', envir = environment(model_f), inherits = TRUE)
  }
  step_size <- 1/length(step_lengths)

  # Extract names of everything with an abundance record
  stock_names <- regmatches(names(tmp), regexec("^detail_(.+)__num$", names(tmp)))
  # Pick out the capture group, throw away everything else
  stock_names <- vapply(stock_names, function (x) {
      if (length(x) == 2) x[[2]] else as.character(NA)
  }, as.character(1))
  stock_names <- stock_names[!is.na(stock_names)]

  ##############################################################################
  ##############################################################################
  
  ## --------------------------------------------------------------
  ## Catch distributions
  ## --------------------------------------------------------------
  if (any(grepl('^cdist_.+__num$', names(tmp)))){
  
    ## To-do: add in age and length attributes from stock objects
    ## Merge together catch distribution observations and predictions
    dat <- 
      tmp[grep('^cdist_.+__num$', names(tmp))] %>%
      purrr::map(as.data.frame.table, stringsAsFactors = FALSE) %>%
      dplyr::bind_rows(.id = 'comp') %>%
      dplyr::mutate(data_function = gsub('(cdist)_([A-Za-z]+)_(.+)_(model|obs)__num', '\\2', .data$comp),
                    #type = gsub('(cdist)_([A-Za-z]+)_([A-Za-z]+)_(.+)_(model|obs)__num', '\\3', .data$comp),
                    #fleetnames = gsub('(cdist)_([A-Za-z]+)_([A-Za-z]+)_(.+)_(model|obs)__num', '\\4', .data$comp),
                    origin = gsub('(cdist)_([A-Za-z]+)_(.+)_(model|obs)__num', '\\4', .data$comp),
                    name = gsub('(cdist)_([A-Za-z]+)_(.+)_(model|obs)__num', '\\3', .data$comp),
                    #length = gsub('len', '', .data$length) %>% as.numeric(),
                    area = tryCatch(as.numeric(as.factor(.data$area)),
                                    error = function(z) 1)) %>%
      split_length() %>%
      dplyr::group_by(.data$name) %>% 
      dplyr::group_modify(~replace_inf(.x)) %>% 
      dplyr::ungroup() %>% 
      dplyr::mutate(avg.length = (.data$lower + .data$upper)/2) %>% 
      dplyr::select(-.data$comp) %>%
      extract_year_step() %>%
      tidyr::pivot_wider(names_from = .data$origin, values_from = .data$Freq) %>% 
      dplyr::rename(observed = .data$obs, predicted = .data$model) %>% 
      tibble::as_tibble()
  
    ## Add stock and stock_re columns if they dont exist
    if (!('stock' %in% names(dat))) dat$stock <- NA
    if (!('stock_re' %in% names(dat))) dat$stock_re <- NA
  
    ## Maturity
    ## TO-DO ADD LOWER AND UPPER
    nastock_index <- is.na(dat$stock) & is.na(dat$stock_re)
    if (all(nastock_index)){
      stockdist <- NULL
    }else{
      stockdist <- 
        dat[!nastock_index,] %>% 
        dplyr::group_by(.data$year, .data$step, .data$area, .data$length, .data$age, .data$name) %>%
        dplyr::mutate(pred.ratio = .data$predicted / sum(.data$predicted, na.rm = TRUE),
                      obs.ratio = .data$observed / sum(.data$observed, na.rm = TRUE),
                      length = .data$avg.length) %>%
        dplyr::ungroup() %>% 
        dplyr::select(.data$name, .data$year, .data$step, .data$area, 
                      dplyr::matches("stock|stock_re"), .data$lower, .data$upper, .data$length, .data$age, 
                      .data$observed, .data$obs.ratio, .data$predicted, .data$pred.ratio)
    }

    ## Age and Length distributions
    if (all(!nastock_index)){
      catchdist.fleets <- NULL
    }else{
      catchdist.fleets <- 
        dat[nastock_index,] %>% 
        dplyr::group_by(.data$year, .data$step, .data$area, .data$name) %>%
        dplyr::mutate(total.catch = sum(.data$observed, na.rm = TRUE),
                      total.pred = sum(.data$predicted, na.rm = TRUE),
                      obs = .data$observed,
                      pred = .data$predicted,
                      observed = .data$observed / sum(.data$observed, na.rm = TRUE),
                      predicted = .data$predicted / sum(.data$predicted, na.rm = TRUE),
                      residuals = ifelse(.data$observed == 0, NA, .data$observed - .data$predicted)) %>% 
        dplyr::ungroup() %>%
        split_age() %>%
        dplyr::group_by(name) %>% 
        dplyr::mutate(age = dplyr::case_when(length(unique(age)) == 1 ~ paste0('all', lower_age),
                                   TRUE ~ paste0('age', lower_age))) %>% 
        dplyr::ungroup() %>% 
        dplyr::select(.data$name, .data$year, .data$step, .data$area, 
                      dplyr::matches("stock|stock_re"), .data$length, .data$lower, .data$upper, .data$avg.length, .data$age,  
                      .data$obs, .data$total.catch, .data$observed,
                      .data$pred, .data$total.pred, .data$predicted, .data$residuals)
    }
  } else {
    dat <- NULL
    stockdist <- NULL
    catchdist.fleets <- NULL
  }
  
  ## -------------------------------------------------------------------------
  
  ## Survey or other indices 
  if (any(grepl('^.+_surveyindices_.+__num$|^.+_surveyindices_.+__wgt$', names(tmp)))){
    
    sidat_params <- 
      tmp[grepl('^.+_surveyindices_.+__params$', names(tmp))] %>% 
      purrr::map(stats::setNames, c('alpha', 'beta')) %>% 
      dplyr::bind_rows(.id = 'id') %>%
      dplyr::mutate(id = gsub('^cdist_|^adist_|_model__params$', '', .data$id))
    
    sidat <- 
      tmp[grep('(^adist|^cdist)_surveyindices_.+__num$|(^adist|^cdist)_surveyindices_.+__wgt$',names(tmp))] %>%
      purrr::map(as.data.frame.table, stringsAsFactors = FALSE) %>%
      dplyr::bind_rows(.id = 'comp') %>%
      dplyr::mutate(index = gsub('(cdist|adist)_([A-Za-z]+)_([A-Za-z]+)_(.+)_(model|obs)__(num|wgt)', '\\2', .data$comp),
                    type = gsub('(cdist|adist)_([A-Za-z]+)_([A-Za-z]+)_(.+)_(model|obs)__(num|wgt)', '\\3', .data$comp),
                    fleet = gsub('(cdist|adist)_([A-Za-z]+)_([A-Za-z]+)_(.+)_(model|obs)__(num|wgt)', '\\4', .data$comp),
                    origin = gsub('(cdist|adist)_([A-Za-z]+)_([A-Za-z]+)_(.+)_(model|obs)__(num|wgt)', '\\5', .data$comp),
                    name = gsub('(cdist|adist)_([A-Za-z]+)_([A-Za-z]+)_(.+)_(model|obs)__(num|wgt)', '\\2.\\4', .data$comp),
                    #length = gsub('len', '', .data$length) %>% as.numeric(),
                    area = tryCatch(as.numeric(as.factor(.data$area)),
                                    error = function(z) 1)) %>%
      split_length() %>% 
      extract_year_step() %>%
      dplyr::select(-.data$comp) %>%
      tidyr::pivot_wider(names_from = .data$origin, values_from = .data$Freq) %>%
      dplyr::mutate(id = paste(.data$index, .data$type, .data$fleet, sep = '_')) %>% 
      dplyr::left_join(sidat_params, by = 'id') %>% 
      dplyr::rename(observed = .data$obs, number = .data$model, intercept = .data$alpha, slope = .data$beta) %>% 
      dplyr::mutate(predicted = ifelse(.data$type == 'log', 
                                       exp(.data$intercept) * .data$number^.data$slope,
                                       .data$intercept + .data$slope * .data$number)) %>% 
      dplyr::select(.data$name, .data$year, .data$step, .data$area, .data$length, .data$lower, .data$upper, 
                    .data$fleet, .data$index, .data$type, .data$intercept, .data$slope, 
                    .data$observed, .data$number, .data$predicted) 
    
  }else{
    sidat <- NULL
  }
  
  ## ----------------------------------------------------------------------
  #
  ## Suitability taken from predator.prey
  ## Suitability
  if (any(grepl('^suit_(.+)_(.+)__report', names(tmp)))){
    suit_re <- paste0(
        "^suit",
        "_(\\Q", paste(stock_names, collapse = "\\E|\\Q"), "\\E)",
        "_(.+)",
        "__report" )
    # New-style g3a_suitability_report() output
    suitability <-
      tmp[grep(suit_re, names(tmp))] %>%
      purrr::map(as.data.frame.table, stringsAsFactors = F) %>%
      dplyr::bind_rows(.id = 'comp') %>%
      dplyr::mutate(stock = gsub(suit_re, '\\1', .data$comp),
                    fleet = gsub(suit_re, '\\2', .data$comp)) %>%
      split_length() %>%
      extract_year_step() %>%
      dplyr::rename(suit = "Freq") %>%
      dplyr::select(-c("comp")) %>%
      identity()

  } else if (any(grepl('detail_(.+)__suit_', names(tmp)))){

    suitability <-
      tmp[grep('detail_(.+)__suit_', names(tmp))] %>%
      purrr::map(as.data.frame.table, stringsAsFactors = F) %>%
      dplyr::bind_rows(.id = 'comp') %>%
      dplyr::mutate(stock = gsub('detail_(.+)__suit_(.+)$', '\\1', .data$comp),
                    fleet = gsub('detail_(.+)__suit_(.+)$', '\\2', .data$comp)) %>% 
                    #area = as.numeric(.data$area)) %>%
                    #length = gsub('len','', .data$length) %>% as.numeric(),
                    #age = gsub('age','', .data$age) %>% as.numeric()) %>%
      split_length() %>%
      extract_year_step() %>%
      dplyr::rename(suit = .data$Freq) %>%
      dplyr::select(.data$year, .data$step, .data$area, .data$stock,
                    .data$length, .data$upper, .data$lower, .data$age, .data$fleet, .data$suit) %>%
      tibble::as_tibble()

  }else{
    warning("Cannot find suitability tables, no suitability data will be included in results")
    suitability <- data.frame(
        year = 1,
        step = 1,
        area = "a",
        stock = "x",
        length = "1:10",
        upper = 1,
        lower = 1,
        age = "1",
        fleet = "x",
        suit = 1 )[c(),,drop = FALSE]
  }
  
  ## --------------------------------------------------------------------------------
  
  ## Likelihood
  if (any(grepl('^nll_', names(tmp)))){
    
    likelihood <-
      tmp[grep('^nll_', names(tmp))] %>%
      purrr::map(~tibble::tibble(time=names(.), lik_score = as.numeric(.))) %>% 
      dplyr::bind_rows(.id='lik_comp') %>% 
      dplyr::filter(!grepl('understocking', .data$lik_comp)) %>%
      dplyr::mutate(type = gsub('.+(wgt|num|weight)','\\1', .data$lik_comp),
                    component = gsub('nll_(cdist|adist)_([A-Za-z]+)_(.+)__(wgt$|num$|weight$)', '\\3', .data$lik_comp),
                    data_type = gsub('nll_(cdist|adist)_([A-Za-z]+)_(.+)__(wgt$|num$|weight$)', '\\1_\\2', .data$lik_comp)) %>%
      dplyr::select(-.data$lik_comp) %>%
      tidyr::pivot_wider(names_from = .data$type, values_from = .data$lik_score) %>%
      extract_year_step()  
    
  }else{
    likelihood <- NULL
  }
  
  ## ---------------------------------------------------------------------------
  ## Stock-recruitment
  ## ---------------------------------------------------------------------------
  
  if (any(grepl('detail_(.+)__(spawnednum$|renewalnum$)', names(tmp)))){
    
    stock.recruitment <-
      tmp[grepl('detail_(.+)__(spawnednum$|renewalnum$)', names(tmp))] %>% 
      purrr::map(as.data.frame.table, stringsAsFactors = FALSE) %>% 
      dplyr::bind_rows(.id = 'comp') %>% 
      dplyr::mutate(stock = gsub('detail_(.+)__(spawnednum$|renewalnum$)', '\\1', .data$comp),
                    age = gsub('age', '', .data$age) %>% as.numeric()) %>% 
      extract_year_step() %>%
      dplyr::group_by(.data$stock) %>% 
      dplyr::filter(.data$age == min(.data$age))
    ## ADD Recruit-at-age & and min(age) should be taken from stock attributes
    if (!is.null(rec.steps)) stock.recruitment <- stock.recruitment %>% dplyr::filter(.data$step %in% rec.steps)
    stock.recruitment <- stock.recruitment %>%
      dplyr::group_by(.data$stock, .data$year, .data$step, .data$area, .data$age) %>% 
      dplyr::summarise(recruitment = sum(.data$Freq)) %>% 
      dplyr::ungroup() 
    
  }else{
    stock.recruitment <- NULL
  }
  
  ## ---------------------------------------------------------------------------
  ## ---------------------------------------------------------------------------
  
  ## Stock reports
  weight_reports <- 
    tmp[grepl('detail_(.+)__wgt', names(tmp))] %>% 
    purrr::map(as.data.frame.table, stringsAsFactors = FALSE, responseName = 'weight') %>% 
    dplyr::bind_rows(.id='comp') %>% 
    dplyr::mutate(stock = gsub('detail_(.+)__wgt', '\\1', .data$comp)) %>% 
    dplyr::select(-.data$comp) 
  
  if (any(grepl("__cons$", names(tmp)))) {
    # detail_(prey)_(pred)__cons arrays
    consumption_re <- paste0(
        "^detail",
        "_(\\Q", paste(stock_names, collapse = "\\E|\\Q"), "\\E)",
        "_(.+)",
        "__cons" )
  } else {
    # Pre-predation stype __predby_ arrays
    consumption_re <- paste0(
        "^detail",
        "_(\\Q", paste(stock_names, collapse = "\\E|\\Q"), "\\E)",
        "__predby",
        "_(.+)$" )
  }

  fleet_reports <- 
    tmp[grepl(consumption_re, names(tmp))] %>%
    purrr::map(as.data.frame.table, stringsAsFactors = FALSE, responseName = 'biomass_consumed') %>% 
    dplyr::bind_rows(.id='comp') %>% 
    dplyr::mutate(stock = gsub(consumption_re, '\\1', .data$comp),
                  fleet = gsub(consumption_re, '\\2', .data$comp)) %>%
    dplyr::select(-.data$comp) %>% 
    dplyr::left_join(weight_reports, by = c("time", "area", "stock", "age", "length")) %>% 
    split_length() %>% 
    dplyr::group_by(.data$stock, .data$fleet) %>% 
    dplyr::group_modify(~replace_inf(.x)) %>% 
    dplyr::ungroup() %>%
    dplyr::mutate(avg.length = (.data$lower + .data$upper)/2) %>% 
    dplyr::mutate(number_consumed = 
                    ifelse(.data$biomass_consumed == 0, 0, .data$biomass_consumed / .data$weight)) %>%
    extract_year_step() %>% 
    tibble::as_tibble()
  
  ## Abundance
  num_reports <- 
    tmp[grepl('detail_(.+)__num', names(tmp))] %>% 
    purrr::map(as.data.frame.table, stringsAsFactors = FALSE, responseName = 'abundance') %>% 
    dplyr::bind_rows(.id='comp') %>% 
    dplyr::mutate(stock = gsub('detail_(.+)__num', '\\1', .data$comp)) %>% 
    dplyr::select(-.data$comp) %>% 
    dplyr::left_join(weight_reports, by = c("time", "area", "stock", "age", "length")) %>% 
    split_length() %>%
    dplyr::group_by(.data$stock) %>% 
    dplyr::group_modify(~replace_inf(.x)) %>% 
    dplyr::ungroup() %>%
    dplyr::mutate(avg.length = (.data$lower + .data$upper)/2) %>% 
    extract_year_step() %>% 
    tibble::as_tibble()
  
  ## Stock full
  stock.full <- 
    num_reports %>%
    dplyr::group_by(.data$year, .data$step, .data$area, .data$stock, .data$avg.length) %>% 
    dplyr::summarise(number = sum(.data$abundance), 
                     mean_weight = sum(.data$abundance*.data$weight)/sum(.data$abundance), .groups = 'drop') %>% 
    tidyr::replace_na(list(mean_weight = 0)) %>% 
    dplyr::rename(length = .data$avg.length)
  
  
  ## Stock std
  stock.std <- 
    num_reports %>% 
    dplyr::group_by(.data$year, .data$step, .data$area, .data$stock, .data$age) %>% 
    dplyr::summarise(number = sum(.data$abundance),
                     mean_length = sum(.data$avg.length*.data$abundance)/sum(.data$abundance),
                     stddev_length = sqrt(sum((.data$avg.length-.data$mean_length)^2*.data$abundance)/sum(.data$abundance)),
                     mean_weight = sum(.data$abundance*.data$weight)/sum(.data$abundance)) %>% 
    dplyr::ungroup() %>% 
    dplyr::mutate(age = gsub('age', '', .data$age) %>% as.numeric())
  
  ## Stock prey
  stock.prey <- 
    fleet_reports %>%
    dplyr::group_by(.data$year, .data$step, .data$area, .data$stock, .data$age) %>%
    dplyr::summarise(number_consumed = sum(.data$number_consumed),
                     biomass_consumed = sum(.data$biomass_consumed)) %>% 
    dplyr::ungroup() %>% 
    dplyr::mutate(age = gsub('age', '', .data$age) %>% as.numeric()) %>% 
    dplyr::left_join(stock.std %>% 
                       dplyr::select(.data$year, .data$step, .data$area, .data$stock, .data$age, .data$number),
                     by = c("year", "step", "area", "stock", "age")) %>% 
    dplyr::mutate(mortality = -log(1 - .data$number_consumed / .data$number)/step_size) 
  
  ## Predator prey
  predator.prey <- 
    fleet_reports %>%
    dplyr::left_join(suitability) %>%
    dplyr::left_join(num_reports %>% dplyr::select(-c(upper,lower,avg.length)) %>% dplyr::rename(bioweight = weight), by = c('year', 'step', 'stock', 'area', 'age', 'length')) %>% 
    dplyr::mutate(suit = dplyr::case_when(number_consumed == 0 ~ 0, .default = .data$suit)) %>% 
    dplyr::mutate(length = .data$avg.length,
                  harv.bio = .data$abundance * .data$bioweight * .data$suit) %>% 
    dplyr::group_by(.data$year, .data$step, .data$area, .data$stock, .data$fleet, .data$length) %>%
    dplyr::summarise(number_consumed = sum(.data$number_consumed),
                     biomass_consumed = sum(.data$biomass_consumed),
                     harv.bio = sum(.data$harv.bio)) %>% 
    dplyr::left_join(stock.full, by = c("year", "step", "area", "stock", "length")) %>% 
    dplyr::mutate(mortality = -log(1 - .data$number_consumed / .data$number)/step_size) %>% 
    tidyr::replace_na(list(mortality = 0)) %>% 
    dplyr::ungroup() %>% 
    dplyr::mutate(tb = number * mean_weight) %>% 
    dplyr::group_by(.data$year, .data$step, .data$area, .data$stock, .data$fleet) %>%
    dplyr::mutate(suit = .data$harv.bio / .data$tb,
                  suit = ifelse(is.finite(.data$suit), .data$suit, 0)) %>%
    dplyr::rename(predator = .data$fleet, prey = .data$stock) %>% 
    dplyr::select(-c(.data$number, .data$mean_weight)) %>% 
    dplyr::ungroup()
  
  ## Fleet info
  fleet.catches <- 
    predator.prey %>% 
    dplyr::group_by(.data$year, .data$step, .data$area, .data$predator, .data$prey) %>% 
    dplyr::summarise(amount = sum(.data$biomass_consumed), .groups = 'drop') %>%
    dplyr::rename(fleet = .data$predator, stock = .data$prey)
  
  fleet.info <- 
    predator.prey %>% 
    dplyr::select(.data$year,
                  .data$step, 
                  .data$area,
                  fleet = .data$predator, 
                  stock = .data$prey, 
                  .data$length, 
                  .data$harv.bio) %>% 
    dplyr::group_by(.data$year, .data$step, .data$area, .data$fleet) %>%
    dplyr::summarise(harv.bio = sum(.data$harv.bio)) %>%
    dplyr::left_join(fleet.catches %>% 
                       dplyr::group_by(.data$year, .data$step, .data$fleet, .data$area) %>% 
                       dplyr::summarise(amount = sum(.data$amount), .groups = 'drop'),
                     by = c('year', 'step', 'area', 'fleet')) %>%
    dplyr::group_by(.data$year, .data$step, .data$area, .data$fleet) %>%
    dplyr::mutate(amount = ifelse(is.na(.data$amount), 0, .data$amount),
                  harv.rate = .data$amount / .data$harv.bio) %>% 
    dplyr::ungroup()
  
  ## Suitability over fleets                 
  harv.suit <- 
    predator.prey %>%
    dplyr::group_by(.data$year, .data$step, .data$prey, .data$length) %>%
    dplyr::filter(.data$biomass_consumed > 0) %>%
    dplyr::summarise(suit = sum(.data$biomass_consumed * .data$suit) / sum(.data$biomass_consumed)) %>%
    dplyr::rename(stock = .data$prey)
  
  ## Annual F
  f.age.range <- 
    stock.prey %>% 
    dplyr::group_by(.data$stock) %>% 
    dplyr::summarise(age.min = max(.data$age),age.max=max(.data$age))
  
  ## TO-DO: Add weighted mortality
  f.by.year <- 
    stock.prey %>%
    dplyr::left_join(f.age.range,by="stock") %>% 
    dplyr::group_by(.data$stock, .data$year, .data$area) %>%
    dplyr::summarise(catch = sum(.data$biomass_consumed),
                     num.catch = sum(.data$number_consumed),
                     F = mean(.data$mortality[.data$age >= .data$age.min & .data$age <= .data$age.max]))
  
  ## Re-calculate stock.std and stock.full if we are printing at the end of the timestep
  if (printatstart == 0){
    
    ## Stock reports
    weight_reports <- 
      tmp[grepl('endprint_(.+)__wgt', names(tmp))] %>% 
      purrr::map(as.data.frame.table, stringsAsFactors = FALSE, responseName = 'weight') %>% 
      dplyr::bind_rows(.id='comp') %>% 
      dplyr::mutate(stock = gsub('endprint_(.+)__wgt', '\\1', .data$comp)) %>% 
      dplyr::select(-.data$comp) 
    
    ## Abundance
    num_reports <- 
      tmp[grepl('endprint_(.+)__num', names(tmp))] %>% 
      purrr::map(as.data.frame.table, stringsAsFactors = FALSE, responseName = 'abundance') %>% 
      dplyr::bind_rows(.id='comp') %>% 
      dplyr::mutate(stock = gsub('endprint_(.+)__num', '\\1', .data$comp)) %>% 
      dplyr::select(-.data$comp) %>% 
      dplyr::left_join(weight_reports, by = c("time", "area", "stock", "age", "length")) %>% 
      split_length() %>%
      dplyr::group_by(.data$stock) %>% 
      dplyr::group_modify(~replace_inf(.x)) %>% 
      dplyr::ungroup() %>%
      dplyr::mutate(avg.length = (.data$lower + .data$upper)/2) %>% 
      extract_year_step() %>% 
      tibble::as_tibble()
    
    ## Stock full
    stock.full <- 
      num_reports %>%
      dplyr::group_by(.data$year, .data$step, .data$area, .data$stock, .data$avg.length) %>% 
      dplyr::summarise(number = sum(.data$abundance), 
                       mean_weight = mean(.data$weight)) %>% 
      dplyr::ungroup() %>% 
      dplyr::rename(length = .data$avg.length)
    
    ## Stock std
    stock.std <- 
      num_reports %>% 
      dplyr::group_by(.data$year, .data$step, .data$area, .data$stock, .data$age) %>% 
      dplyr::summarise(number = sum(.data$abundance),
                       mean_length = sum(.data$avg.length*.data$abundance)/sum(.data$abundance),
                       stddev_length = sqrt(sum((.data$avg.length-.data$mean_length)^2*.data$abundance)/sum(.data$abundance)),
                       mean_weight = sum(.data$abundance*.data$weight)/sum(.data$abundance)) %>% 
      dplyr::ungroup() %>% 
      dplyr::mutate(age = gsub('age', '', .data$age) %>% as.numeric())
    
  }
  
  ## Annual output
  res.by.year <- 
    stock.full %>%
    dplyr::filter(.data$step %in% steps) %>%
    dplyr::left_join(harv.suit,
                     by = c('stock', 'year', 'step', 'length')) %>%
    dplyr::group_by(.data$stock, .data$year, .data$area, .data$step) %>%
    dplyr::summarise(total.number = sum(.data$number),
                     total.biomass = sum(.data$number * .data$mean_weight),
                     harv.biomass = sum(.data$number * .data$suit * .data$mean_weight, na.rm = TRUE)) %>%
    dplyr::left_join(f.by.year,
                     by = c('stock', 'year', 'area')) %>% 
    dplyr::left_join(stock.recruitment %>% 
                       dplyr::group_by(.data$stock, .data$year, .data$area) %>% 
                       dplyr::summarise(recruitment = sum(.data$recruitment)),
                     by = c('stock', 'year', 'area')) %>% 
    dplyr::ungroup()
  
  out <- list(
    sidat = sidat,
    stockdist = stockdist,
    catchdist.fleets = catchdist.fleets,
    suitability = predator.prey %>% 
      dplyr::select(.data$year,.data$step,area=.data$area, stock=.data$prey,
                    fleet=.data$predator,.data$length,.data$suit) %>% 
      dplyr::ungroup(),
    likelihood = likelihood,
    stock.prey = stock.prey,
    stock.std = stock.std,
    stock.full = stock.full,
    fleet.info = fleet.info,
    predator.prey = predator.prey,
    stock.recruitment = stock.recruitment,
    res.by.year = res.by.year,
    params = out_params,
    score = data.frame(nll = tmp$nll)
  )
  
  ## Add 'summary' attribute if it exists
  if ('summary' %in% names(attributes(out_params))){
    attributes(out)$summary <- attr(out_params, 'summary')
  }
  
  class(out) <- c('gadget.fit',class(out))
  return(out)
  
}

#' @title Extracts year and step columns
#' @description Gadget3 reports have a time column in the format 'YEAR-STEP'. This function creates a 'year' and 'step' column by splitting the existing 'time' column. This is useful for processing gagdet3 reports.
#' @param data dataframe of gadget3 reports. Must include a 'time' column.
#' @export
extract_year_step <- function(data){
  if (!("time" %in% names(data))) return(data)
  
  if (any(!grepl('-', data$time))){
    data[!grepl('-', data$time), 'time'][[1]] <- paste0(data[!grepl('-', data$time), 'time'][[1]], '-0')
  }
  
  data %>% 
    tidyr::extract(col = 'time', 
                   into = c('year', 'step'), 
                   regex='^(\\d+)-(\\d+)$', convert=TRUE) %>% 
    return()
  
}

## -----------------------------------------------------------------------------
## Internal functions used by g3_fit
## -----------------------------------------------------------------------------

split_age <- function(data){
  if (!('age' %in% names(data))) return(data)
  
  tmp <-
    data %>% 
    dplyr::mutate(lower_age = gsub('(.+):(.+)', '\\1', .data$age),
                  upper_age = gsub('(.+):(.+)', '\\2', .data$age)) 
  return(tmp)
}

split_length <- function(data){
  if (!('length' %in% names(data))) return(data)
  
  tmp <-
    data %>% 
    dplyr::mutate(lower = gsub('(.+):(.+)', '\\1', .data$length) %>% as.numeric(),
                  upper = gsub('(.+):(.+)', '\\2', .data$length) %>% as.numeric())
  
  return(tmp)
}

replace_inf <- function(data){
  ind <- is.infinite(data$upper)
  if (any(ind)){
    replacement <- abs(diff(sort(unique(data$upper[!ind]), decreasing = TRUE)[1:2]))
    data$upper[ind] <- data$lower[ind] + replacement
  }
  return(data)
}