SL.ODTR: SuperLearner Estimation and Evaluation of ODTR

Documented in SL.blip SL.blip.alpha SL.blip.c SL.vote

#' @name SL.blip
#' @aliases SL.blip
#' @title Blip-based SL
#' @description SuperLearner for ODTR that returns estimated blips.
#'
#' @param V subset covariates for designing ODTR
#' @param W covariates
#' @param A txt
#' @param Y outcome
#' @param ab range of Y
#' @param QAW.reg Q(A,W) regression object
#' @param g.reg g(A|W) regression object
#' @param blip.SL.library blip SL library
#' @param risk.type risk type
#' @param grid size
#' @param newV new V
#' @param VFolds number of folds
#' @param family family for outcome
#' @param discrete.SL whether discrete SL (choose one algorithm) or continuous SL (weighted combination of algorithms)
#'
#' @return SL blip object
#'
#' @export
#'

SL.blip = function(V, W, A, Y, ab, QAW.reg, g.reg, blip.SL.library,
                   risk.type, grid.size,
                   newV = NULL, VFolds, family, discrete.SL){

  n = length(A)

  libraryNames = c(blip.SL.library) # will be trouble if screeners are used?
  numalgs = length(libraryNames)

  if (risk.type != "CV MSE") {
    if (discrete.SL) {
      simplex.grid = diag(numalgs)
      colnames(simplex.grid) = libraryNames
    } else {
      simplex.grid = rbind(diag(numalgs), simplex.sample(n = numalgs, N = grid.size)$samples)
      colnames(simplex.grid) = libraryNames
    }
  }

  SL.out = list()

  folds = sample(1:VFolds, size = n, replace = T)
  CV.risk_fun = function(i) {
    train_ind = folds != i
    test_ind = folds == i
    g.reg.train = SuperLearner(Y = A[train_ind], X = W[train_ind, , drop = F], SL.library = g.reg$SL.library$library$predAlgorithm, family = "binomial")
    g1W.pred = predict(g.reg.train, data.frame(W), type = "response")$pred
    gAW.pred = ifelse(A == 1, g1W.pred, 1 - g1W.pred)
    QAW.reg.train = SuperLearner(Y = Y[train_ind], X = data.frame(A, W)[train_ind,], SL.library = QAW.reg$SL.library$library$predAlgorithm, family = family)
    QAW.pred = predict(QAW.reg.train, newdata = data.frame(W, A = A), type = "response")$pred
    Q1W.pred = predict(QAW.reg.train, newdata = data.frame(W, A = 1), type = "response")$pred
    Q0W.pred = predict(QAW.reg.train, newdata = data.frame(W, A = 0), type = "response")$pred
    D = (2*A-1)/gAW.pred * (Y-QAW.pred) + Q1W.pred - Q0W.pred
    SL.init.train = getpreds.blip.fun(Y = D[train_ind], X = V[train_ind,,drop = F],
                                      SL.library = blip.SL.library,
                                      newX = V[test_ind,,drop = F], family = 'gaussian')
    candidate.blips.test = SL.init.train$library.predict
    D.test = D[test_ind]
    if (risk.type == "CV TMLE" | risk.type == "CV TMLE CI") {
      candidates.blipsXalpha.test = candidate.blips.test%*%t(simplex.grid)
      dopt.combos.test = apply(candidates.blipsXalpha.test > 0, 2, as.numeric)
      Qdopt.combos.test = sapply(1:nrow(simplex.grid), function(x) predict(QAW.reg.train, newdata = data.frame(W[test_ind,,drop = F], A = dopt.combos.test[,x]), type = "response")$pred)
      tmle.obj.test = lapply(1:nrow(simplex.grid), function(x) tmle.d.fun(A = A[test_ind], Y = Y[test_ind], d = dopt.combos.test[,x], Qd = Qdopt.combos.test[,x], gAW = gAW.pred[test_ind], ab = ab))
      risk.combos.test = -unlist(lapply(tmle.obj.test, function(x) x$psi))
      risk.var.combos.test = unlist(lapply(tmle.obj.test, function(x) var(x$IC)))
      toreturn = list(candidate.blips.test = candidate.blips.test, risk.combos.test = risk.combos.test, risk.var.combos.test = risk.var.combos.test)
    } else if (risk.type == "CV MSE") {
      #risk.combos.test = sapply(1:nrow(simplex.grid), function(x) mean((D[test_ind] - candidates.blipsXalpha.test[,x])^2))
      toreturn = list(D.test = D.test, candidate.blips.test = candidate.blips.test)
    }
    return(toreturn)
  }

  CV.risk.obj = lapply(1:VFolds, CV.risk_fun)

  if (risk.type == "CV TMLE" | risk.type == "CV TMLE CI") {
    CV.risk = colMeans(do.call('rbind', lapply(1:VFolds, function(i) CV.risk.obj[[i]]$risk.combos.test)))
    var_CV.TMLE = colMeans(t(sapply(1:VFolds, function(i) CV.risk.obj[[i]]$risk.var.combos.test)))/n
    CI_CV.TMLE_upper = CV.risk + qnorm(0.975)*sqrt(var_CV.TMLE)
    CI_CV.TMLE_lower = CV.risk - qnorm(0.975)*sqrt(var_CV.TMLE)
  } else if (risk.type == "CV MSE") {
    Z = do.call('rbind', lapply(1:VFolds, function(i) CV.risk.obj[[i]]$candidate.blips.test))
    D.test = do.call('c', lapply(1:VFolds, function(i) CV.risk.obj[[i]]$D.test))
    CV.risk = apply(Z, 2, function(x) mean((x - D.test) ^ 2))
  }

  if (risk.type == "CV TMLE CI") {
    SL.out$CV.risk_min = list(est = min(CI_CV.TMLE_upper))
    SL.out$coef = simplex.grid[which.min(CI_CV.TMLE_upper),]
  } else if (risk.type == "CV TMLE") {
    SL.out$CV.risk_min = list(est = min(CV.risk))
    SL.out$coef = simplex.grid[which.min(CV.risk),]
  } else if (risk.type == "CV MSE") {
    if (discrete.SL) {
      SL.out$CV.risk_min = list(est = min(CV.risk))
      SL.out$coef = rep(0, length(CV.risk))
      SL.out$coef[which.min(CV.risk)] = 1
    } else {
      fit.nnls <- nnls(Z, D.test)
      initCoef <- coef(fit.nnls)
      initCoef[is.na(initCoef)] <- 0
      if (sum(initCoef) > 0) {
        coef <- initCoef / sum(initCoef)
      } else {
        warning("All algorithms have zero weight", call. = FALSE)
        coef <- initCoef
      }
      SL.out$coef = coef
    }
  }

  g1W.pred = predict(g.reg, data.frame(W), type = "response")$pred
  gAW.pred = ifelse(A == 1, g1W.pred, 1 - g1W.pred)
  QAW.pred = predict(QAW.reg, newdata = data.frame(W, A = A), type = "response")$pred
  Q1W.pred = predict(QAW.reg, newdata = data.frame(W, A = 1), type = "response")$pred
  Q0W.pred = predict(QAW.reg, newdata = data.frame(W, A = 0), type = "response")$pred
  D = (2*A-1)/gAW.pred * (Y-QAW.pred) + Q1W.pred - Q0W.pred # this is same thing as D1 - D0 (weighted Y1 - Y0)

  SL.init = getpreds.blip.fun(Y = D, X = V, SL.library = blip.SL.library, newX = newV, family = "gaussian")

  # applying chosen coefficients
  SL.out$libraryNames = names(SL.out$coef) = libraryNames
  SL.out$fitBlipLibrary = SL.init$fitLibrary
  SL.out$blipFamily = SL.init$family
  SL.out$libraryBlipPredict = SL.init$library.predict
  SL.out$SL.predict = SL.out$libraryBlipPredict%*%SL.out$coef
  if (risk.type == "CV TMLE") {
    SL.out$CV.risk_min$CI = c(lowerCI = CI_CV.TMLE_lower[which.min(CV.risk)],
                              upperCI = CI_CV.TMLE_upper[which.min(CV.risk)])
  }
  if (risk.type == "CV TMLE CI") {
    SL.out$CV.risk_min$CI = c(lowerCI = CI_CV.TMLE_lower[which.min(CI_CV.TMLE_upper)],
                              upperCI = CI_CV.TMLE_upper[which.min(CI_CV.TMLE_upper)])
  }
  if (risk.type == "CV MSE") {
    SL.out$forCoef = list(Z = Z, D.test = D.test, D = D)
  }

  return(SL.out)


}




#' @name SL.vote
#' @aliases SL.vote
#' @title Vote-based SL
#' @description SuperLearner for ODTR that returns estimated txts under rule
#'
#' @param V subset covariates for designing ODTR
#' @param W covariates
#' @param A txt
#' @param Y outcome
#' @param ab range of Y
#' @param QAW.reg Q(A,W) regression object
#' @param g.reg g(A|W) regression object
#' @param blip.SL.library blip SL library
#' @param risk.type risk type
#' @param grid size
#' @param newV newV
#' @param VFolds number of folds
#' @param dopt.SL.library dopt SL library. Options: "DonV", "Qlearn", "OWL", "EARL", "optclass", "RWL", "treatall", "treatnone". Can also be "all".
#' @param family family for outcome
#' @param discrete.SL whether discrete SL (choose one algorithm) or continuous SL (weighted combination of algorithms)
#'
#' @return SL vote object
#'
#' @export
#'

SL.vote = function(V, W, A, Y, ab, QAW.reg, g.reg, blip.SL.library,
                   dopt.SL.library,
                   risk.type,
                   grid.size,
                   newV = NULL,
                   VFolds, family, discrete.SL){

  n = length(A)
  family = ifelse(max(Y) <= 1 & min(Y) >= 0, "binomial", "gaussian")

  if (sum(dopt.SL.library == "all")>0) { dopt.SL.library = c("DonV", "Qlearn", "OWL", "EARL", "optclass", "RWL", "treatall", "treatnone")}
  numalgs = length(dopt.SL.library)-1 + length(blip.SL.library) #must have DonV

  if (discrete.SL) {
    simplex.grid = diag(numalgs)
  } else {
    simplex.grid = rbind(diag(numalgs), simplex.sample(n = numalgs, N = grid.size)$samples)
  }

  SL.out = list()

  folds = sample(1:VFolds, size = n, replace = T)
  CV.risk_fun = function(i){
    train_ind = folds != i
    test_ind = folds == i
    g.reg.train = SuperLearner(Y = A[train_ind], X = W[train_ind,,drop=F], SL.library = g.reg$SL.library$library$predAlgorithm, family = "binomial")
    g1W.pred = predict(g.reg.train, data.frame(W), type = "response")$pred
    gAW.pred = ifelse(A == 1, g1W.pred, 1 - g1W.pred)
    QAW.reg.train = SuperLearner(Y = Y[train_ind], X = data.frame(A, W)[train_ind,], SL.library = QAW.reg$SL.library$library$predAlgorithm, family = family)
    candidate.dopts.test = getpreds.dopt.fun(dopt.SL.library = dopt.SL.library, blip.SL.library = blip.SL.library,
                                             W = W[train_ind,,drop=F], V = V[train_ind,,drop=F], A = A[train_ind], Y = Y[train_ind],
                                             newV = V[test_ind,], QAW.reg = QAW.reg.train, g.reg = g.reg.train,
                                             family = family)
    candidates.doptsXalpha.test = as.matrix(candidate.dopts.test$library.predict)%*%t(simplex.grid)
    dopt.combos.test = apply(candidates.doptsXalpha.test > .5, 2, as.numeric)
    Qdopt.combos.test = sapply(1:nrow(simplex.grid), function(x) predict(QAW.reg.train, newdata = data.frame(W[test_ind,,drop=F], A = dopt.combos.test[,x]), type = "response")$pred)
    tmle.obj.test = lapply(1:nrow(simplex.grid), function(x) tmle.d.fun(A = A[test_ind], Y = Y[test_ind], d = dopt.combos.test[,x], Qd = Qdopt.combos.test[,x], gAW = gAW.pred[test_ind], ab = ab))
    risk.combos.test = -unlist(lapply(tmle.obj.test, function(x) x$psi))
    risk.var.combos.test = unlist(lapply(tmle.obj.test, function(x) var(x$IC)))
    toreturn = list(risk.combos.test = risk.combos.test, risk.var.combos.test = risk.var.combos.test)
    return(toreturn)
  }
  CV.risk.obj = lapply(1:VFolds, CV.risk_fun)
  CV.risk = colMeans(t(sapply(1:VFolds, function(i) CV.risk.obj[[i]]$risk.combos.test)))
  if (risk.type == "CV TMLE" | risk.type == "CV TMLE CI") {
    var_CV.TMLE = colMeans(t(sapply(1:VFolds, function(i) CV.risk.obj[[i]]$risk.var.combos.test)))/n
    CI_CV.TMLE_upper = CV.risk + qnorm(0.975)*sqrt(var_CV.TMLE)
    CI_CV.TMLE_lower = CV.risk - qnorm(0.975)*sqrt(var_CV.TMLE)
  }

  if (risk.type == "CV TMLE CI") {
    SL.out$CV.risk_min = list(est = min(CI_CV.TMLE_upper))
    SL.out$coef = simplex.grid[which.min(CI_CV.TMLE_upper),]
  } else {
    SL.out$CV.risk_min = list(est = min(CV.risk))
    SL.out$coef = simplex.grid[which.min(CV.risk),]
  }


  # predict on new data
  SL.init = getpreds.dopt.fun(dopt.SL.library = dopt.SL.library, blip.SL.library = blip.SL.library,
                              W = W, V = V, A = A, Y = Y, newV = newV,
                              QAW.reg = QAW.reg, g.reg = g.reg,
                              family = family)
  SL.out$librarydoptPredict = SL.init$library.predict
  SL.out$SL.predict = as.numeric(as.matrix(SL.out$librarydoptPredict)%*%SL.out$coef > .5)
  SL.out$libraryNames = names(SL.out$coef) = names(SL.out$librarydoptPredict)
  SL.out$fitdoptLibrary = SL.init$fitLibrary
  SL.out$doptFamily = family

  if (risk.type == "CV TMLE") {
    SL.out$CV.risk_min$CI = c(lowerCI = CI_CV.TMLE_lower[which.min(CV.risk)],
                              upperCI = CI_CV.TMLE_upper[which.min(CV.risk)])
  }
  if (risk.type == "CV TMLE CI") {
    SL.out$CV.risk_min$CI = c(lowerCI = CI_CV.TMLE_lower[which.min(CI_CV.TMLE_upper)],
                              upperCI = CI_CV.TMLE_upper[which.min(CI_CV.TMLE_upper)])
  }

  return(SL.out)


}






#' @name SL.blip.c
#' @aliases SL.blip.c
#' @title Blip-based SL with constant
#' @description SuperLearner for ODTR that returns estimated blips. Note this minimizes EYd!
#'
#' @param V subset covariates for designing ODTR
#' @param W covariates
#' @param A txt
#' @param Y outcome
#' @param ab range of Y
#' @param QAW.reg Q(A,W) regression object
#' @param g.reg g(A|W) regression object
#' @param blip.SL.library blip SL library
#' @param risk.type risk type
#' @param grid size
#' @param newV new V
#' @param VFolds number of folds
#' @param family family for outcome
#' @param discrete.SL whether discrete SL (choose one algorithm) or continuous SL (weighted combination of algorithms)
#' @param cs_to_try constants to try for blip
#'
#' @import dplyr
#'
#' @return SL blip c object
#'
#' @export
#'

SL.blip.c = function(V, W, A, Y, ab, QAW.reg, g.reg, blip.SL.library,
                     risk.type, grid.size,
                     newV = NULL, VFolds, family, discrete.SL, cs_to_try){

  n = length(A)

  libraryNames = c(blip.SL.library)
  numalgs = length(libraryNames)

  if (discrete.SL) {
    simplex.grid = diag(numalgs)
  } else {
    simplex.grid = rbind(diag(numalgs), simplex.sample(n = numalgs, N = grid.size)$samples)
  }

  colnames(simplex.grid) = libraryNames

  SL.out = list()

  folds = sample(1:VFolds, size = n, replace = T)
  CV.risk_fun = function(i) {
    train_ind = folds != i
    test_ind = folds == i
    g.reg.train = SuperLearner(Y = A[train_ind], X = W[train_ind,], SL.library = g.reg$SL.library$library$predAlgorithm, family = "binomial")
    g1W.pred = predict(g.reg.train, data.frame(W), type = "response")$pred
    gAW.pred = ifelse(A == 1, g1W.pred, 1 - g1W.pred)
    QAW.reg.train = SuperLearner(Y = Y[train_ind], X = data.frame(A, W)[train_ind,], SL.library = QAW.reg$SL.library$library$predAlgorithm, family = family)
    QAW.pred = predict(QAW.reg.train, newdata = data.frame(W, A = A), type = "response")$pred
    Q1W.pred = predict(QAW.reg.train, newdata = data.frame(W, A = 1), type = "response")$pred
    Q0W.pred = predict(QAW.reg.train, newdata = data.frame(W, A = 0), type = "response")$pred
    D = (2*A-1)/gAW.pred * (Y-QAW.pred) + Q1W.pred - Q0W.pred
    SL.init.train = getpreds.blip.fun(Y = D[train_ind], X = V[train_ind,],
                                      SL.library = blip.SL.library,
                                      newX = V[test_ind,], family = 'gaussian')
    candidate.blips.test = SL.init.train$library.predict
    candidates.blipsXalpha.test = candidate.blips.test%*%t(simplex.grid)
    # stochastic rule
    gstarAW_test = apply(candidates.blipsXalpha.test, 2, function(blip_test) lapply(cs_to_try, function(c) ifelse(A[test_ind] == 1, (1-plogis(blip_test/c)), plogis(blip_test/c))))
    gstar1W_test = apply(candidates.blipsXalpha.test, 2, function(blip_test) lapply(cs_to_try, function(c) (1-plogis(blip_test/c))))
    gstar0W_test = apply(candidates.blipsXalpha.test, 2, function(blip_test) lapply(cs_to_try, function(c) plogis(blip_test/c)))
    tmle.obj.test = lapply(1:length(cs_to_try), function(y) lapply(1:dim(simplex.grid)[1], function(x) tmle.g.fun(A = A[test_ind], Y = Y[test_ind],
                                                                                                                  QAW = QAW.pred[test_ind], Q1W = Q1W.pred[test_ind], Q0W = Q0W.pred[test_ind],
                                                                                                                  gstarAW = gstarAW_test[[x]][[y]], gstar1W = gstar1W_test[[x]][[y]], gstar0W = gstar0W_test[[x]][[y]],
                                                                                                                  gAW = gAW.pred[test_ind],
                                                                                                                  ab = ab)))
    risk.combos.test = lapply(1:dim(simplex.grid)[1], function(y) lapply(1:length(cs_to_try), function(x) tmle.obj.test[[x]][[y]]$psi))
    names(risk.combos.test) = paste0("lib = ", 1:length(risk.combos.test))
    risk.var.combos.test = lapply(1:dim(simplex.grid)[1], function(y) lapply(1:length(cs_to_try), function(x) var(tmle.obj.test[[x]][[y]]$IC)))
    names(risk.var.combos.test) = paste0("lib = ", 1:length(risk.combos.test))

    toreturn = list(risk.combos.test = risk.combos.test, risk.var.combos.test = risk.var.combos.test)
    return(toreturn)
  }

  CV.risk.obj = lapply(1:VFolds, CV.risk_fun)

  Psi_gstar = lapply(CV.risk.obj, "[[", 1)
  names(Psi_gstar) = paste0("fold", 1:VFolds)
  Var_gstar = lapply(CV.risk.obj, "[[", 2)
  names(Var_gstar) = paste0("fold", 1:VFolds)
  res_gstar = expand.grid(c = cs_to_try, blip = 1:dim(simplex.grid)[1], fold = c(1:VFolds))
  res_gstar$name = names(unlist(Psi_gstar))
  res_gstar$psi = unlist(Psi_gstar)
  res_gstar$var = unlist(Var_gstar)
  res_gstar = suppressMessages(res_gstar %>% group_by(blip, c) %>% summarise(psi = mean(psi), var = mean(var)/n))
  res_gstar$upperCI = with(res_gstar, psi + qnorm(0.975)*sqrt(var))
  res_gstar$var = NULL

  if (risk.type == "CV TMLE CI") {
    SL.out$CV.risk_min = list(est = min(res_gstar$upperCI))
    SL.out$coef = simplex.grid[res_gstar$blip[which.min(res_gstar$upperCI)],]
    SL.out$c = res_gstar$c[which.min(res_gstar$upperCI)]
  } else {
    SL.out$CV.risk_min = list(est = min(res_gstar$psi))
    SL.out$coef = simplex.grid[res_gstar$blip[which.min(res_gstar$psi)],]
    SL.out$c = res_gstar$c[which.min(res_gstar$psi)]
  }

  g1W.pred = predict(g.reg, W, type = "response")$pred
  gAW.pred = ifelse(A == 1, g1W.pred, 1 - g1W.pred)
  QAW.pred = predict(QAW.reg, newdata = data.frame(W, A = A), type = "response")$pred
  Q1W.pred = predict(QAW.reg, newdata = data.frame(W, A = 1), type = "response")$pred
  Q0W.pred = predict(QAW.reg, newdata = data.frame(W, A = 0), type = "response")$pred
  D = (2*A-1)/gAW.pred * (Y-QAW.pred) + Q1W.pred - Q0W.pred # this is same thing as D1 - D0 (weighted Y1 - Y0)

  SL.init = getpreds.blip.fun(Y = D, X = V, SL.library = blip.SL.library, newX = newV, family = "gaussian")

  # applying chosen coefficients and c
  SL.out$libraryNames = names(SL.out$coef) = libraryNames
  SL.out$fitBlipLibrary = SL.init$fitLibrary
  SL.out$blipFamily = SL.init$family
  SL.out$libraryBlipPredict = SL.init$library.predict
  SL.out$SL.predict = SL.out$libraryBlipPredict%*%SL.out$coef

  return(SL.out)


}









#' @name SL.blip.alpha
#' @aliases SL.blip.alpha
#' @title Blip-based SL with alpha
#' @description SuperLearner for ODTR that returns estimated blips. Note this minimizes EYd!
#'
#' @param V subset covariates for designing ODTR
#' @param W covariates
#' @param A txt
#' @param Y outcome
#' @param ab range of Y
#' @param QAW.reg Q(A,W) regression object
#' @param g.reg g(A|W) regression object
#' @param blip.SL.library blip SL library
#' @param risk.type risk type
#' @param grid size
#' @param newV new V
#' @param VFolds number of folds
#' @param family family for outcome
#' @param discrete.SL whether discrete SL (choose one algorithm) or continuous SL (weighted combination of algorithms)
#' @param alphas_to_try constants to try for blip
#'
#' @import dplyr
#' @return SL blip alpha object
#'
#' @export
#'

SL.blip.alpha = function(V, W, A, Y, ab, QAW.reg, g.reg, blip.SL.library,
                         risk.type, grid.size,
                         newV = NULL, VFolds, family, discrete.SL, alphas_to_try){

  if (family != "binomial") {
    stop("SL.blip.alpha not supported for continuous outcomes yet")
  }
  n = length(A)

  libraryNames = c(blip.SL.library)
  numalgs = length(libraryNames)

  if (discrete.SL) {
    simplex.grid = diag(numalgs)
  } else {
    simplex.grid = rbind(diag(numalgs), simplex.sample(n = numalgs, N = grid.size)$samples)
  }

  colnames(simplex.grid) = libraryNames

  SL.out = list()

  folds = sample(1:VFolds, size = n, replace = T)
  CV.risk_fun = function(i) {
    train_ind = folds != i
    test_ind = folds == i
    g.reg.train = SuperLearner(Y = A[train_ind], X = W[train_ind,], SL.library = g.reg$SL.library$library$predAlgorithm, family = "binomial")
    g1W.pred = predict(g.reg.train, data.frame(W), type = "response")$pred
    g0W.pred = 1 - g1W.pred
    gAW.pred = ifelse(A == 1, g1W.pred, g0W.pred)
    QAW.reg.train = SuperLearner(Y = Y[train_ind], X = data.frame(A, W)[train_ind,], SL.library = QAW.reg$SL.library$library$predAlgorithm, family = family)
    QAW.pred = predict(QAW.reg.train, newdata = data.frame(W, A = A), type = "response")$pred
    Q1W.pred = predict(QAW.reg.train, newdata = data.frame(W, A = 1), type = "response")$pred
    Q0W.pred = predict(QAW.reg.train, newdata = data.frame(W, A = 0), type = "response")$pred
    D = (2*A-1)/gAW.pred * (Y-QAW.pred) + Q1W.pred - Q0W.pred
    varAW.pred = QAW.pred*(1-QAW.pred)
    var1W.pred = Q1W.pred*(1-Q1W.pred)
    var0W.pred = Q0W.pred*(1-Q0W.pred)
    numA = gAW.pred/varAW.pred
    num1 = g1W.pred/var1W.pred
    num0 = g0W.pred/var0W.pred
    denom = g1W.pred/var1W.pred + g0W.pred/var0W.pred
    gstarv1W = num1/denom
    gstarv0W = num0/denom
    gstarvAW = numA/denom
    SL.init.train = getpreds.blip.fun(Y = D[train_ind], X = V[train_ind,],
                                      SL.library = blip.SL.library,
                                      newX = V[test_ind,], family = 'gaussian')
    candidate.blips.test = SL.init.train$library.predict
    candidates.blipsXalpha.test = candidate.blips.test%*%t(simplex.grid)
    dopt.combos.test = apply(candidates.blipsXalpha.test <= 0, 2, as.numeric)
    # stochastic rule
    gdn_1W_test = dopt.combos.test
    gdn_0W_test = 1-gdn_1W_test
    gdn_AW_test = apply(gdn_1W_test, 2, function(x) ifelse(A[test_ind] == 1, x, 1-x))
    gstarAW_test = apply(gdn_AW_test, 2, function(gdn_AW_test) lapply(alphas_to_try, function(alpha) (1-alpha)*gdn_AW_test + alpha*gstarvAW[test_ind]))
    gstar1W_test = apply(gdn_1W_test, 2, function(gdn_1W_test) lapply(alphas_to_try, function(alpha) (1-alpha)*gdn_1W_test + alpha*gstarv1W[test_ind]))
    gstar0W_test = apply(gdn_0W_test, 2, function(gdn_0W_test) lapply(alphas_to_try, function(alpha) (1-alpha)*gdn_0W_test + alpha*gstarv0W[test_ind]))
    tmle.obj.test = lapply(1:length(alphas_to_try), function(y) lapply(1:dim(simplex.grid)[1], function(x) tmle.g.fun(A = A[test_ind], Y = Y[test_ind],
                                                                                                                      QAW = QAW.pred[test_ind], Q1W = Q1W.pred[test_ind], Q0W = Q0W.pred[test_ind],
                                                                                                                      gstarAW = gstarAW_test[[x]][[y]], gstar1W = gstar1W_test[[x]][[y]], gstar0W = gstar0W_test[[x]][[y]],
                                                                                                                      gAW = gAW.pred[test_ind],
                                                                                                                      ab = ab)))
    risk.combos.test = lapply(1:dim(simplex.grid)[1], function(y) lapply(1:length(alphas_to_try), function(x) tmle.obj.test[[x]][[y]]$psi))
    names(risk.combos.test) = paste0("lib = ", 1:length(risk.combos.test))
    risk.var.combos.test = lapply(1:dim(simplex.grid)[1], function(y) lapply(1:length(alphas_to_try), function(x) var(tmle.obj.test[[x]][[y]]$IC)))
    names(risk.var.combos.test) = paste0("lib = ", 1:length(risk.combos.test))

    toreturn = list(risk.combos.test = risk.combos.test, risk.var.combos.test = risk.var.combos.test)
    return(toreturn)
  }

  CV.risk.obj = lapply(1:VFolds, CV.risk_fun)

  Psi_gstar = lapply(CV.risk.obj, "[[", 1)
  names(Psi_gstar) = paste0("fold", 1:VFolds)
  Var_gstar = lapply(CV.risk.obj, "[[", 2)
  names(Var_gstar) = paste0("fold", 1:VFolds)
  res_gstar = expand.grid(alpha = alphas_to_try, blip = 1:dim(simplex.grid)[1], fold = c(1:VFolds))
  res_gstar$name = names(unlist(Psi_gstar))
  res_gstar$psi = unlist(Psi_gstar)
  res_gstar$var = unlist(Var_gstar)
  res_gstar = suppressMessages(res_gstar %>% group_by(blip, alpha) %>% summarise(psi = mean(psi), var = mean(var)/n))
  res_gstar$upperCI = with(res_gstar, psi + qnorm(0.975)*sqrt(var))
  res_gstar$var = NULL

  if (risk.type == "CV TMLE CI") {
    SL.out$CV.risk_min = list(est = min(res_gstar$upperCI))
    SL.out$coef = simplex.grid[res_gstar$blip[which.min(res_gstar$upperCI)],]
    SL.out$alpha = res_gstar$alpha[which.min(res_gstar$upperCI)]
  } else {
    SL.out$CV.risk_min = list(est = min(res_gstar$psi))
    SL.out$coef = simplex.grid[res_gstar$blip[which.min(res_gstar$psi)],]
    SL.out$alpha = res_gstar$alpha[which.min(res_gstar$psi)]
  }

  g1W.pred = predict(g.reg, W, type = "response")$pred
  g0W.pred = 1 - g1W.pred
  gAW.pred = ifelse(A == 1, g1W.pred, g0W.pred)
  QAW.pred = predict(QAW.reg, newdata = data.frame(W, A = A), type = "response")$pred
  Q1W.pred = predict(QAW.reg, newdata = data.frame(W, A = 1), type = "response")$pred
  Q0W.pred = predict(QAW.reg, newdata = data.frame(W, A = 0), type = "response")$pred
  D = (2*A-1)/gAW.pred * (Y-QAW.pred) + Q1W.pred - Q0W.pred # this is same thing as D1 - D0 (weighted Y1 - Y0)

  SL.init = getpreds.blip.fun(Y = D, X = V, SL.library = blip.SL.library, newX = newV, family = "gaussian")

  # applying chosen coefficients and c
  SL.out$libraryNames = names(SL.out$coef) = libraryNames
  SL.out$fitBlipLibrary = SL.init$fitLibrary
  SL.out$blipFamily = SL.init$family
  SL.out$libraryBlipPredict = SL.init$library.predict
  SL.out$SL.predict = SL.out$libraryBlipPredict%*%SL.out$coef

  return(SL.out)


}