vibr: Variable Importance in Black-Box Regression

# sbatch --job-name=basic -p general -N 1 --mem 112G -n 64 -t 10-00:00:00 --wrap="Rscript --vanilla basic_test.R > basic_test.txt"

library(mvtnorm)
library(vibr)
#library(txshift)
library(sl3)
library(future)

simspline <- function(k, x, degree=2){
  basis.mat <- matrix(NA,nrow=length(x), ncol=(1+length(k))*degree)
  colidx = 1
  for(knot in 0:length(k)){
    for(deg in 1:(degree)){
      if(knot==0) b <- x
      if(knot >0) b <- pmax(0, x-k[knot])
      basis.mat[,colidx] <- b^deg
      colidx = colidx + 1
    }
  }
  basis.mat
}
#simspline(c(-1, 0, 1), rnorm(100), degree=2)


dgm <- function(n, delta, beta, degree=2, zk = c(-1, 0, 1), sigma=3){
  fullbeta <- rep(0, 20)
  fullbeta[1:length(beta)] <- beta
  px <- 0.2
  z <- rnorm(n,0,3)
  x <- rbinom(n,1,px)
  q <- rnorm(n,0,3)
  zint <- z+delta
  xint <- ifelse(x==0, rbinom(n,1,delta/(1-px)), x)
  yfun <- function(z,x,beta,knots=zk){
    zbasis <- simspline(knots, z, degree)
    pz <- ncol(zbasis)
    x*beta[1] + x*(5+z)*beta[2] + zbasis %*% beta[3:(3+pz-1)]
  }
  yerr <- rnorm(n,0,sigma)
  y <- yerr + yfun(z,x,fullbeta)
  yintz <- yerr + yfun(zint,x,fullbeta)
  yintx <- yerr + yfun(z,xint,fullbeta)
  (trdiff <- c(mean(yintz-y), mean(yintx-y), 0.0))
  res = list(X = cbind(z,x,q), y=y, tr = trdiff)
  attr(res, "yfun") = function(z,x) yfun(z,x,beta=fullbeta, knots=zk)
  attr(res, "beta") = fullbeta
  attr(res, "sigma") = sigma
  res
}



dgm_ks <- function(n, delta){
 #kang and schafer
  Z <- do.call(cbind, lapply(1:4, function(x) rnorm(n, 0, 1)))
  X = Z
  yerr <- rnorm(n)
  pyfun <- function(Z){
    210 + 27.4*Z[,1] + 13.7*Z[,2] + 13.7*Z[,3] + 13.7*Z[,4]
  }
  pxfun <- function(Z){
    .expit(-Z[,1] + 0.5*Z[,2] - 0.25*Z[,3] - 0.1*Z[,4])
  }
  y <- pyfun(Z) + yerr
  X[,1] = exp(Z[,1]/2)
  X[,2] = Z[,2]/ 1 + exp(Z[,1]) + 10
  X[,3] = (Z[,1]*Z[,3]/25 + 0.6)^3
  X[,4] = (Z[,2] +Z[,4] +20)^2
  list(y=y,X=X)
}

density_learners <- function(n_bins=c(3,8), histtypes=c("equal.mass")){
  #sl3::sl3_list_learners("density") # see all available
  density_learners=list()
  idx = 1
  nm <- paste0("dens_sp_gam_")
  density_learners[[idx]] <- Lrnr_density_semiparametric$new(name=nm, mean_learner = Lrnr_gam$new(), var_learner = NULL)
  idx  = idx+1
  nm <- paste0("dens_sp_mean_")
  density_learners[[idx]] <- Lrnr_density_semiparametric$new(name=nm, mean_learner = Lrnr_mean$new(), var_learner = NULL)
  idx  = idx+1
  for(nb in n_bins){
    for(histtype in histtypes){
      nm = paste0("hist_Unadj_", nb, histtype)
      density_learners[[idx]] <- Lrnr_density_discretize$new(name=nm, categorical_learner = Lrnr_mean$new(), n_bins = nb, bin_method=histtype)
      idx  = idx+1
    }
  }
  density_learners
}

continuous_learners <- function(){
  #sl3::sl3_list_learners("continuous")
  continuous_learners=list(
    Lrnr_mean$new(name="Mean"),
    Lrnr_glm$new(name="OLS", family=gaussian()),
    Pipeline$new(Lrnr_define_interactions$new(name="INT", list(c("x", "z"), c("z", "z"))), Lrnr_glmnet$new(name="LASSO", alpha=1.0)),
    Lrnr_gam$new(name="GAM")
    #Pipeline$new(Lrnr_define_interactions$new(name="INT", list(c("x", "z"), c("z", "z"))), Lrnr_glm$new(name="OLS"))
  )
  continuous_learners
}

binary_learners <- function(){
  #sl3::sl3_list_learners("binomial")
  bin_learners=list(
    Lrnr_glm$new(name="LOGIT", family=binomial()),
    Lrnr_mean$new(name="Mean")
  )
  bin_learners
}



testerrorhandle <- function(){
  set.seed(12312)
  dat = dgm(n=50, delta = 0.05, beta = c(1,0,1), degree=2, zk = c(-1.5, 0, 1.5))
  dat$tr
  V = data.frame(wt=rep(1,length(dat$y)))
  (errtest <- varimp(data.frame(dat$X),Y=dat$y, V=V, delta=.05, Y_learners=.default_continuous_learners()[c(1,2)],
                 Xdensity_learners=.default_density_learners()[3:4], Xbinary_learners=.default_binary_learners()[c(1,2,4)],
                 verbose=FALSE, estimator="TMLEX", estimand="diff", weights="wt", scale_continuous = FALSE,
                 xfitfolds=3, foldrepeats=3))
}

testtxshift <- function(){
  set.seed(12312)
  dat = dgm( n=200, delta = 0.05, beta = c(1,0,1), degree=2, zk = c(-1.5, 0, 1.5))
  dat$tr
  lm(dat$y~., data=data.frame(dat$X/.05))

  W = dat$X[,2:3]
  Xsub = dat$X[,1,drop=FALSE]
  V = data.frame(wt=rep(1,length(dat$y)))
  (vi0 <- varimp(data.frame(dat$X),Y=dat$y, V=V, delta=.05, Y_learners=.default_continuous_learners(),
                 Xdensity_learners=.default_density_learners(), Xbinary_learners=.default_binary_learners(),
                 verbose=FALSE, estimator="TMLE", estimand="diff", weights="wt", scale_continuous = FALSE))


  (vi01 <- varimp(X=Xsub, W=W,Y=dat$y, V=V, delta=.05, Y_learners=.default_continuous_learners(),
                 Xdensity_learners=.default_density_learners(), Xbinary_learners=.default_binary_learners(),
                 verbose=FALSE, estimator="TMLE", estimand="diff", weights="wt", scale_continuous = FALSE))
  # plug in cross fit estimator
  (vi01b <- varimp(X=Xsub, W=W,Y=dat$y, V=V, delta=.05, Y_learners=.default_continuous_learners(),
                  Xdensity_learners=.default_density_learners(), Xbinary_learners=.default_binary_learners(),
                  verbose=FALSE, estimator="GCOMPX", estimand="diff", weights="wt", scale_continuous = FALSE,
                  foldrepeats =10, xfitfolds=2))
  (vi0 <- varimp(data.frame(dat$X),Y=dat$y, V=V, delta=.05, Y_learners=.default_continuous_learners(),
                 Xdensity_learners=.default_density_learners(), Xbinary_learners=.default_binary_learners(),
                 verbose=FALSE, estimator="TMLEX", estimand="diff", weights="wt", scale_continuous = FALSE,
                 foldrepeats =10, xfitfolds=5))
  (vi11<-varimp_refit(vi01, Xsub,W,Y=dat$y, estimator="AIPW", delta = .05))
  (vi12<-varimp_refit(vi01, Xsub,W,Y=dat$y, estimator="IPW", delta = .05))
  (vi1<-varimp_refit(vi0, X=data.frame(dat$X),Y=dat$y, estimator="AIPW", delta = .05))
  (vi3<-varimp_refit(vi0, X=data.frame(dat$X),Y=dat$y, estimator="IPW", delta = .05))
  (vi2<-varimp_refit(vi0, X=data.frame(dat$X),Y=dat$y, estimator="GCOMP", delta = .05))
  cor(as.matrix(cbind(tmle=vi0$rank, aipw=vi1$rank, gcomp=vi2$rank, ipw=vi3$rank)))

  #
  (vimp2 <- varimp(data.frame(dat$X),Y=dat$y, V=V, delta=.1, Y_learners=continuous_learners()[1:3],
                  Xdensity_learners=density_learners()[[1]], Xbinary_learners=binary_learners(),
                  verbose=FALSE, estimator="TMLE", estimand="diff", B=5, weights="wt"))
  set.seed(123123)
  (vimp <- varimp(data.frame(dat$X),Y=dat$y, delta=.1, Y_learners=continuous_learners()[1:3],
                  Xdensity_learners=density_learners(), Xbinary_learners=binary_learners(),
                  verbose=FALSE, estimator="AIPW", estimand="diff"))
  (vimp2 <- varimp(data.frame(dat$X),Y=dat$y, delta=.1, Y_learners=continuous_learners()[1:3],
                  Xdensity_learners=density_learners(), Xbinary_learners=binary_learners(),
                  verbose=FALSE, estimator="AIPW", estimand="diff", B=5))
  (vimp <- varimp(data.frame(dat$X),Y=dat$y, delta=.1, Y_learners=continuous_learners()[1:3],
                  Xdensity_learners=density_learners(), Xbinary_learners=binary_learners(),
                  verbose=FALSE, estimator="GCOMP", estimand="diff"))
  (vimp2 <- varimp(data.frame(dat$X),Y=dat$y, delta=.1, Y_learners=continuous_learners()[1:3],
                  Xdensity_learners=density_learners(), Xbinary_learners=binary_learners(),
                  verbose=FALSE, estimator="GCOMP", estimand="diff", B=5))
  (vimp <- varimp(data.frame(dat$X),Y=dat$y, delta=.1, Y_learners=continuous_learners()[1:3],
                  Xdensity_learners=density_learners(), Xbinary_learners=binary_learners(),
                  verbose=FALSE, estimator="IPW", estimand="diff"))
  (vimp2 <- varimp(data.frame(dat$X),Y=dat$y, delta=.1, Y_learners=continuous_learners()[1:3],
                  Xdensity_learners=density_learners(), Xbinary_learners=binary_learners(),
                  verbose=FALSE, estimator="IPW", estimand="diff", B=5))

  dat$tr
  summary(lm(y ~ I((.5*z/sd(z))/.1) + I(x/.1), data = data.frame(y=dat$y, dat$X)))$coefficients

}


stabilitytest <- function(...){
  data(metals, package="qgcomp")
  dat = list(X=metals[,c(1:5,23)], y=metals$y) # up t 23

  set.seed(NULL)
  #set.seed(1231)
  (vimp <- varimp(X=data.frame(dat$X),Y=dat$y, delta=.1,
                  Y_learners=.default_continuous_learners(),
                  Xdensity_learners=.default_density_learners(),
                  Xbinary_learners=.default_binary_learners(),
                  verbose=FALSE, estimator="TMLE", estimand="diff"))


  #set.seed(1231)
  (vimp2 <- varimp(data.frame(dat$X),Y=dat$y, delta=.1,
                   Y_learners=.default_continuous_learners(),
                   Xdensity_learners=.default_density_learners(),
                   Xbinary_learners=.default_binary_learners(),
                   verbose=FALSE, estimator="TMLEX", estimand="diff",
                   xfitfolds = 3, foldrepeats = 10))


  set.seed(1231)
  t2 <- sl3::sl3_Task$new(data = data.frame(dat$X, y=dat$y), folds = 20, covariates = names(dat$X), outcome="y")
  set.seed(1231)
  t1 <- sl3::sl3_Task$new(data = data.frame(dat$X, y=dat$y), folds = 20, covariates = names(dat$X), outcome="y")
  t1$folds[[10]]$validation_set
  t2$folds[[10]]$validation_set

  pipe <- Pipeline$new(Lrnr_screener_importance$new(name="rfimpscreen", learner=Lrnr_randomForest$new()), Lrnr_glm$new(name="OLS", family=gaussian()))
  screen = Lrnr_screener_importance$new(name="rfimpscreen", learner=Lrnr_randomForest$new(importance=TRUE))
  screen = Lrnr_screener_importance$new(learner =Lrnr_randomForest$new() )
  fr = Lrnr_xgboost$new()
  fr$train(t1)
  screen$train(t1)
  pipe$train(t1)
  #outcome
  plot(vimp$qfit$predict(), vimp2$qfit$predict()) # stable under a seed
  plot(vimp$qfit$learner_fits$Stack$predict(), vimp2$qfit$learner_fits$Stack$predict()) # stable under a seed
  # density
  plot(vimp$gfits[[1]]$predict()[[1]], vimp2$gfits[[1]]$predict()[[1]])
  plot(vimp$gfits[[2]]$predict()[[1]], vimp2$gfits[[2]]$predict()[[1]])
  plot(vimp$gfits[[6]]$predict()[[1]], vimp2$gfits[[6]]$predict()[[1]])
  plot(vimp$gfits[[6]]$learner_fits$Stack$predict()[[1]], vimp2$gfits[[6]]$learner_fits$Stack$predict()[[1]])
  plot(vimp$gfits[[6]]$learner_fits$Stack$predict()[[2]], vimp2$gfits[[6]]$learner_fits$Stack$predict()[[2]])
  plot(vimp$gfits[[6]]$learner_fits$Stack$predict()[[3]], vimp2$gfits[[6]]$learner_fits$Stack$predict()[[3]])
  plot(vimp$gfits[[6]]$learner_fits$Stack$predict()[[4]], vimp2$gfits[[6]]$learner_fits$Stack$predict()[[4]])
  cbind(vimp$gfits[[6]]$learner_fits$Stack$predict()[[4]], vimp2$gfits[[6]]$learner_fits$Stack$predict()[[4]])
  plot(vimp$res$est, vimp2$res$est)
  plot(vimp$res$se, vimp2$res$se)
  plot(vimp$res$z, vimp2$res$z)
  plot(order(abs(vimp$res$est)), order(abs(vimp2$res$est)))
  plot(vimp$res$est-vimp2$res$est, vimp$res$se-vimp2$res$se)
}


jointtest <- function(){
  set.seed(12312)
  dat = dgm( n=1000, delta = 0.05, beta = c(1,0,1), degree=2, zk = c(-1.5, 0, 1.5))
  #dat = dgm( n=1000, delta = 0.01, beta = c(1,-2,2,0,0,0), degree=2, zk = c(-1.5,-.25,0.25), sigma=1.0))
  vi <- varimp(X=data.frame(dat$X),
               Y=dat$y,
               delta=0.01,
               estimator="GCOMP",
               Y_learners = c(sl3::Lrnr_glm$new())
  )
  vij <- .varimp_gcomp_joint(
    X=data.frame(dat$X),
    Y=dat$y,
    expnms = c("x", "z"),
    delta=0.01,
    Y_learners = c(sl3::Lrnr_glm$new()),
    estimand="diff",
    verbose=FALSE
  )
  vijb <- .varimp_gcomp_joint_boot(
    X=data.frame(dat$X),
    Y=dat$y,
    expnms = c("x", "z"),
    delta=0.01,
    Y_learners = c(sl3::Lrnr_glm$new()),
    estimand="diff",
    verbose=FALSE
  )
  vi
  vij
  vijb
  (coefs <- lm(dat$y~., data = data.frame(.scale_continuous(dat$X)))$coefficients[-1]*0.01)
  sum(coefs)
  (coefs <- lm(dat$y~.+.^2, data = data.frame(.scale_continuous(dat$X)))$coefficients[-1])
}



analyze <- function(i, B=1, outfile=NULL, ...){
  dat = dgm(...)
  (vimp <- varimp(X=data.frame(dat$X),Y=dat$y, delta=0.1, Y_learners=.default_continuous_learners(),
                  Xdensity_learners=.default_density_learners()[-3], Xbinary_learners=.default_binary_learners(),
                  verbose=FALSE, estimator="TMLE", scale_continuous = FALSE))
  (vimp2 <- varimp_refit(vimp, X=data.frame(dat$X),Y=dat$y, estimator="IPW", delta = .1))
  (vimp3 <- varimp_refit(vimp, X=data.frame(dat$X),Y=dat$y, estimator="GCOMP", delta = .1))
  (vimp4 <- varimp(X=data.frame(dat$X),Y=dat$y, delta=0.1, Y_learners=.default_continuous_learners(),
                   Xdensity_learners=.default_density_learners()[-3], Xbinary_learners=.default_binary_learners(),
                   verbose=FALSE, estimator="TMLEX", scale_continuous = FALSE, xfitfolds=5, foldrepeats=B))
  #
  obj <- as.matrix(vimp$res)
  obj2 <- as.matrix(vimp2$res)
  obj3 <- as.matrix(vimp3$res)
  obj4 <- as.matrix(vimp4$res)
  tr = dat$tr
  names(tr) <- colnames(dat$X)
  lmfit <- summary(lm(y~., data.frame(y=dat$y, dat$X/0.1)))
  res = c(
    TMLEest = obj[1:3,1],
    TMLEse = obj[1:3,2],
    TMLEXest = obj4[1:3,1],
    TMLEXse = obj4[1:3,2],
    #TMLEbootest = obj4[1:3,1],
    #TMLEbootse = obj4se,#apply(vimp3$boots, 2, sd)
    IPWest = obj2[1:3,1],
    IPWse = obj2[1:3,2],
    GCOMPest = obj3[1:3,1],
    GCOMPse = obj3[1:3,2],
    lmest = lmfit$coefficients[2:4, 1],
    lmse = lmfit$coefficients[2:4, 2],
    tr = tr
  )
  attr(res, "beta") <- attr(dat, "beta")
  attr(res, "yfun") <- attr(dat, "yfun")
  if(!is.null(outfile)) write.table(t(res), outfile, append = TRUE, row.names = FALSE, sep=",", col.names = FALSE)
  res
}


future::plan("sequential")
#dat = dgm(n=300, delta = 0.1, beta = c(2,1, .0))
set.seed(1231)
(res1 <- analyze(1231321, n=500, B=2, delta = 0.1, beta = c(-0.98,0.9,0.01,0.39,0.45,-0.32,0.76,-0.76,0.19,0.8,-0.22,0.94), degree=2, zk = c(-1.5,-.25,0.25), sigma=1.0))

set.seed(1231)
(res2 <- analyze(1231321, n=500, B=20, delta = 0.1, beta = c(-0.98,0.9,0.01,0.39,0.45,-0.32,0.76,-0.76,0.19,0.8,-0.22,0.94), degree=2, zk = c(-1.5,-.25,0.25), sigma=1.0))

#attr(res1, "beta")

#bb = round(runif(12,-1,1), 2)
res1 <- dgm(100,delta = 0.1, beta =c(-0.98,0.9,0.01,0.39,0.45,-0.32,0.76,-0.76,0.19,0.8,-0.22,0.94), degree=2, zk = c(-1.5,-.25,0.25), sigma=1.0)
#ztest <- seq(-10,10,.002)
ztest <- sort(rnorm(10000))
xtest <- rep(c(0,1), length.out=length(ztest))
pxz <- dnorm(ztest,0,3)*dbinom(xtest, 1, .2)
pxzd <- dnorm(ztest-0.1,0,3)*dbinom(xtest, 1, .2)
s <- attr(res1, "sigma")
ey <- attr(res1, "yfun")(ztest,xtest)
ytest <- ey + rnorm(length(ztest), 0, s)
ey0 <- attr(res1, "yfun")(ztest,0)
ey1 <- attr(res1, "yfun")(ztest,1)
pym <- sum(ey*pxz)/sum(pxz)
pyz <- sum(ey*pxzd)/sum(pxzd)
pyx <- pym+.1*(sum(ey1*pxz)/sum(pxz)- sum(ey0*pxz)/sum(pxz))
(trA <- c(tr.z=pyz,tr.x=pyx,tr.q=pym)-pym)

plot(ztest[xtest==0], ey0[xtest==0], type="l", ylim=c(min(c(ey0,ey1)), max(c(ey0,ey1))))
lines(ztest[xtest==1], ey1[xtest==1], type="l", ylim=c(min(c(ey0,ey1)), max(c(ey0,ey1))))
ridx = sample(length(ztest), 200)
points(ztest[ridx],ytest[ridx])
lm(res1$y~x+z, data = data.frame(res1$X))$coefficients*0.1


(ncores <- future::availableCores())
future::plan("multisession", workers=ncores)
#dgm(n=1000000, delta = 0.1, beta = c(2,1, .0))$tr
system.time(res1 <- analyze(1231321, n=500, B=20, delta = 0.1, beta = c(-0.98,0.9,0.01,0.39,0.45,-0.32,0.76,-0.76,0.19,0.8,-0.22,0.94), degree=2, zk = c(-1.5,-.25,0.25), sigma=1.0))

csvout <- "/Users/akeil/temp/vimp_check.csv"
write.table(t(res1), csvout, append = FALSE, row.names = FALSE, sep=",")

resL = future.apply::future_lapply(1:1000, analyze, outfile=csvout, n=500, B=20, delta = 0.1, beta = c(-0.98,0.9,0.01,0.39,0.45,-0.32,0.76,-0.76,0.19,0.8,-0.22,0.94), degree=2, zk = c(-1.5,-.25,0.25), sigma=1.0,
                                   future.seed=TRUE, future.packages=NULL)

readana <- function(file=csvout){
  fl <- read.csv(file)
  fl
}

res = readana()
dim(res)
#res = as.data.frame(do.call(rbind, resL))
(rm <- apply(res, 2, mean))

cipow <- function(res, root="TMLE", exp="x", type="cover"){
  nm = paste0(root, type, ".", exp)
  est = res[,paste0(root, "est.", exp)]
  se = res[,paste0(root, "se.", exp)]
  #tr = rm[paste0("tr.", exp)] # truth based on average across simulations
  dat <- dgm(n=100, delta=0.1,beta = c(-0.98,0.9,0.01,0.39,0.45,-0.32,0.76,-0.76,0.19,0.8,-0.22,0.94), degree=2, zk = c(-1.5,-.25,0.25), sigma=1.0)
  ztest <- seq(-10,10,.002)
  xtest <- rep(c(0,1), length.out=length(ztest))
  pxz <- dnorm(ztest,0,3)*dbinom(xtest, 1, .2)
  pxzd <- dnorm(ztest-0.1,0,3)*dbinom(xtest, 1, .2)
  ey <- attr(dat, "yfun")(ztest,xtest)
  ey0 <- attr(dat, "yfun")(ztest,0)
  ey1 <- attr(dat, "yfun")(ztest,1)
  pym <- sum(ey*pxz)/sum(pxz)
  pyz <- sum(ey*pxzd)/sum(pxzd)
  pyx <- pym+.1*(sum(ey1*pxz)/sum(pxz)- sum(ey0*pxz)/sum(pxz))
  (trA <- c(tr.z=pyz,tr.x=pyx,tr.q=pym)-pym)
  #cat(paste("truth: ", trA, "\n"))
  tr <- trA[paste0("tr.", exp)]
  res[,nm] <<- switch(type,
                      cover95= as.numeric(((est + 1.96*se) > tr) & ((est - 1.96*se) < tr)),
                      cover80= as.numeric(((est + 1.28*se) > tr) & ((est - 1.28*se) < tr)),
                      power= as.numeric(((est - 1.96*se) > 0) | ((est + 1.96*se) < 0)),
                      bias= as.numeric(est-tr),
                      pctBias = 100*as.numeric(est-tr)/tr
  )
}

for(stat in c("cover95", "cover80", "power", "bias", "pctBias")){
  for(estim in c("TMLE", "TMLEX", "IPW", "GCOMP", "lm")){
    for(var in c("z", "x", "q")){
      cipow(res, estim, var, stat)
    }
  }
}


rm[c("tr.z", "tr.x", "tr.q")]
print(apply(res[,  grep("est.", names(res))], 2, function(x) c(mean=mean(x), sd=sd(x))))
print(apply((res)[,grep("bias", names(res))], 2, function(x) c(bias=mean(x), rmse=sqrt(mean(x^2)), sd.bias=sd(x))))
print(apply((res)[,grep("pctBias", names(res))], 2, function(x) c(mean=mean(x), median=median(x))))
print(apply(res[,grep("se[a]*", names(res))], 2, function(x) c(mean=mean(x))))
print(apply(res[, grep("cover95", names(res))], 2, function(x) c(mean=mean(x))))
print(apply(res[, grep("cover80", names(res))], 2, function(x) c(mean=mean(x))))
print(apply(res[, grep("power", names(res))], 2, function(x) c(mean=mean(x))))



#lnr  = Pipeline$new(Lrnr_define_interactions$new(name="INT", list(c(1, 2))), Lrnr_glm$new(name="OLS"))
#XX <- sl3_Task$new(
#  data=data.frame(dat$X, y=dat$y),
#  outcome="y",
#  covariates=names(data.frame(dat$X))
#)
#
#res = lnr$train(XX)
#res$fit_object$learner_fits$OLS$coefficients


#N = 1000
##X  = cbind(x=rbinom(N, 1, 0.5),z=rbinom(N, 1, 0.5))
#X  = cbind(x=rnorm(N, 0, 1),z=rnorm(N, 0, 1))
#y = rnorm(N, X %*% c(1,1), 1)
#mean(y)
#(vimp <- varimp(as.data.frame(X),y, delta=.1, Y_learners=.default_continuous_learners(),
#                Xdensity_learners=.default_density_learners(), Xbinary_learners=binary_learners(),
#                verbose=FALSE, estimator="GCOMP", estimand="diff", scale_continuous = FALSE))
#
alexpkeil1/vibr documentation built on Sept. 13, 2023, 3:20 a.m.
rdrr.io home R language documentation Run R code online
CRAN packages Bioconductor packages R-Forge packages GitHub packages
Note that we can't provide technical support on individual packages. You should contact the package authors for that.
alexpkeil1/vibr
Variable Importance in Black-Box Regression

private_sims/basic_test.R
In alexpkeil1/vibr: Variable Importance in Black-Box Regression

R Package Documentation

Browse R Packages

We want your feedback!

alexpkeil1/vibr Variable Importance in Black-Box Regression

private_sims/basic_test.R In alexpkeil1/vibr: Variable Importance in Black-Box Regression

R Package Documentation

Browse R Packages

We want your feedback!

alexpkeil1/vibr
Variable Importance in Black-Box Regression

private_sims/basic_test.R
In alexpkeil1/vibr: Variable Importance in Black-Box Regression