test-bcf.R
In stochtree: Stochastic Tree Ensembles (XBART and BART) for Supervised Learning and Causal Inference

test_that("MCMC BCF", {
    skip_on_cran()
    
    # Generate simulated data
    n <- 100
    p <- 5
    X <- matrix(runif(n*p), ncol = p)
    mu_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (-7.5) + 
        ((0.25 <= X[,1]) & (0.5 > X[,1])) * (-2.5) + 
        ((0.5 <= X[,1]) & (0.75 > X[,1])) * (2.5) + 
        ((0.75 <= X[,1]) & (1 > X[,1])) * (7.5)
    )
    pi_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (0.2) + 
        ((0.25 <= X[,1]) & (0.5 > X[,1])) * (0.4) + 
        ((0.5 <= X[,1]) & (0.75 > X[,1])) * (0.6) + 
        ((0.75 <= X[,1]) & (1 > X[,1])) * (0.8)
    )
    tau_X <- (
        ((0 <= X[,2]) & (0.25 > X[,2])) * (0.5) + 
        ((0.25 <= X[,2]) & (0.5 > X[,2])) * (1.0) + 
        ((0.5 <= X[,2]) & (0.75 > X[,2])) * (1.5) + 
        ((0.75 <= X[,2]) & (1 > X[,2])) * (2.0)
    )
    Z <- rbinom(n, 1, pi_X)
    noise_sd <- 1
    y <- mu_X + tau_X*Z + rnorm(n, 0, noise_sd)
    test_set_pct <- 0.2
    n_test <- round(test_set_pct*n)
    n_train <- n - n_test
    test_inds <- sort(sample(1:n, n_test, replace = FALSE))
    train_inds <- (1:n)[!((1:n) %in% test_inds)]
    X_test <- X[test_inds,]
    X_train <- X[train_inds,]
    Z_test <- Z[test_inds]
    Z_train <- Z[train_inds]
    pi_test <- pi_X[test_inds]
    pi_train <- pi_X[train_inds]
    mu_test <- mu_X[test_inds]
    mu_train <- mu_X[train_inds]
    tau_test <- tau_X[test_inds]
    tau_train <- tau_X[train_inds]
    y_test <- y[test_inds]
    y_train <- y[train_inds]
    
    # 1 chain, no thinning
    general_param_list <- list(num_chains = 1, keep_every = 1)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
    
    # 1 chain, no thinning, matrix leaf scale parameter provided
    general_param_list <- list(num_chains = 1, keep_every = 1)
    mu_forest_param_list <- list(sigma2_leaf_init = as.matrix(0.5))
    tau_forest_param_list <- list(sigma2_leaf_init = as.matrix(0.5))
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list, 
                         prognostic_forest_params = mu_forest_param_list, 
                         treatment_effect_forest_params = tau_forest_param_list)
    )
    
    # 1 chain, no thinning, scalar leaf scale parameter provided
    general_param_list <- list(num_chains = 1, keep_every = 1)
    mu_forest_param_list <- list(sigma2_leaf_init = 0.5)
    tau_forest_param_list <- list(sigma2_leaf_init = 0.5)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list, 
                         prognostic_forest_params = mu_forest_param_list, 
                         treatment_effect_forest_params = tau_forest_param_list)
    )
    
    # 3 chains, no thinning
    general_param_list <- list(num_chains = 3, keep_every = 1)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
    
    # 1 chain, thinning
    general_param_list <- list(num_chains = 1, keep_every = 5)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
    
    # 3 chains, thinning
    general_param_list <- list(num_chains = 3, keep_every = 5)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
})

test_that("GFR BCF", {
    skip_on_cran()
    
    # Generate simulated data
    n <- 100
    p <- 5
    X <- matrix(runif(n*p), ncol = p)
    mu_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (-7.5) + 
        ((0.25 <= X[,1]) & (0.5 > X[,1])) * (-2.5) + 
        ((0.5 <= X[,1]) & (0.75 > X[,1])) * (2.5) + 
        ((0.75 <= X[,1]) & (1 > X[,1])) * (7.5)
    )
    pi_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (0.2) + 
        ((0.25 <= X[,1]) & (0.5 > X[,1])) * (0.4) + 
        ((0.5 <= X[,1]) & (0.75 > X[,1])) * (0.6) + 
        ((0.75 <= X[,1]) & (1 > X[,1])) * (0.8)
    )
    tau_X <- (
        ((0 <= X[,2]) & (0.25 > X[,2])) * (0.5) + 
        ((0.25 <= X[,2]) & (0.5 > X[,2])) * (1.0) + 
        ((0.5 <= X[,2]) & (0.75 > X[,2])) * (1.5) + 
        ((0.75 <= X[,2]) & (1 > X[,2])) * (2.0)
    )
    Z <- rbinom(n, 1, pi_X)
    noise_sd <- 1
    y <- mu_X + tau_X*Z + rnorm(n, 0, noise_sd)
    test_set_pct <- 0.2
    n_test <- round(test_set_pct*n)
    n_train <- n - n_test
    test_inds <- sort(sample(1:n, n_test, replace = FALSE))
    train_inds <- (1:n)[!((1:n) %in% test_inds)]
    X_test <- X[test_inds,]
    X_train <- X[train_inds,]
    Z_test <- Z[test_inds]
    Z_train <- Z[train_inds]
    pi_test <- pi_X[test_inds]
    pi_train <- pi_X[train_inds]
    mu_test <- mu_X[test_inds]
    mu_train <- mu_X[train_inds]
    tau_test <- tau_X[test_inds]
    tau_train <- tau_X[train_inds]
    y_test <- y[test_inds]
    y_train <- y[train_inds]
    
    # 1 chain, no thinning
    general_param_list <- list(num_chains = 1, keep_every = 1)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 10, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
    
    # 3 chains, no thinning
    general_param_list <- list(num_chains = 3, keep_every = 1)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 10, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
    
    # 1 chain, thinning
    general_param_list <- list(num_chains = 1, keep_every = 5)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 10, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
    
    # 3 chains, thinning
    general_param_list <- list(num_chains = 3, keep_every = 5)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 10, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
    
    # Check for error when more chains than GFR forests
    general_param_list <- list(num_chains = 11, keep_every = 1)
    expect_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 10, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
    
    # Check for error when more chains than GFR forests
    general_param_list <- list(num_chains = 11, keep_every = 5)
    expect_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 10, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
})

test_that("Warmstart BCF", {
    skip_on_cran()
    
    # Generate simulated data
    n <- 100
    p <- 5
    X <- matrix(runif(n*p), ncol = p)
    mu_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (-7.5) + 
        ((0.25 <= X[,1]) & (0.5 > X[,1])) * (-2.5) + 
        ((0.5 <= X[,1]) & (0.75 > X[,1])) * (2.5) + 
        ((0.75 <= X[,1]) & (1 > X[,1])) * (7.5)
    )
    pi_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (0.2) + 
        ((0.25 <= X[,1]) & (0.5 > X[,1])) * (0.4) + 
        ((0.5 <= X[,1]) & (0.75 > X[,1])) * (0.6) + 
        ((0.75 <= X[,1]) & (1 > X[,1])) * (0.8)
    )
    tau_X <- (
        ((0 <= X[,2]) & (0.25 > X[,2])) * (0.5) + 
        ((0.25 <= X[,2]) & (0.5 > X[,2])) * (1.0) + 
        ((0.5 <= X[,2]) & (0.75 > X[,2])) * (1.5) + 
        ((0.75 <= X[,2]) & (1 > X[,2])) * (2.0)
    )
    Z <- rbinom(n, 1, pi_X)
    noise_sd <- 1
    y <- mu_X + tau_X*Z + rnorm(n, 0, noise_sd)
    test_set_pct <- 0.2
    n_test <- round(test_set_pct*n)
    n_train <- n - n_test
    test_inds <- sort(sample(1:n, n_test, replace = FALSE))
    train_inds <- (1:n)[!((1:n) %in% test_inds)]
    X_test <- X[test_inds,]
    X_train <- X[train_inds,]
    Z_test <- Z[test_inds]
    Z_train <- Z[train_inds]
    pi_test <- pi_X[test_inds]
    pi_train <- pi_X[train_inds]
    mu_test <- mu_X[test_inds]
    mu_train <- mu_X[train_inds]
    tau_test <- tau_X[test_inds]
    tau_train <- tau_X[train_inds]
    y_test <- y[test_inds]
    y_train <- y[train_inds]
    
    # Run a BCF model with only GFR
    general_param_list <- list(num_chains = 1, keep_every = 1)
    bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                     propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                     propensity_test = pi_test, num_gfr = 10, num_burnin = 0, 
                     num_mcmc = 0, general_params = general_param_list)
    
    # Save to JSON string
    bcf_model_json_string <- saveBCFModelToJsonString(bcf_model)
    
    # Run a new BCF chain from the existing (X)BCF model
    general_param_list <- list(num_chains = 3, keep_every = 5)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, previous_model_json = bcf_model_json_string, 
                         previous_model_warmstart_sample_num = 1, 
                         general_params = general_param_list)
    )
    
    # Generate simulated data with random effects
    n <- 100
    p <- 5
    X <- matrix(runif(n*p), ncol = p)
    mu_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (-7.5) + 
            ((0.25 <= X[,1]) & (0.5 > X[,1])) * (-2.5) + 
            ((0.5 <= X[,1]) & (0.75 > X[,1])) * (2.5) + 
            ((0.75 <= X[,1]) & (1 > X[,1])) * (7.5)
    )
    pi_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (0.2) + 
            ((0.25 <= X[,1]) & (0.5 > X[,1])) * (0.4) + 
            ((0.5 <= X[,1]) & (0.75 > X[,1])) * (0.6) + 
            ((0.75 <= X[,1]) & (1 > X[,1])) * (0.8)
    )
    tau_X <- (
        ((0 <= X[,2]) & (0.25 > X[,2])) * (0.5) + 
            ((0.25 <= X[,2]) & (0.5 > X[,2])) * (1.0) + 
            ((0.5 <= X[,2]) & (0.75 > X[,2])) * (1.5) + 
            ((0.75 <= X[,2]) & (1 > X[,2])) * (2.0)
    )
    Z <- rbinom(n, 1, pi_X)
    rfx_group_ids <- sample(1:2, size = n, replace = TRUE)
    rfx_basis <- rep(1, n)
    rfx_coefs <- c(-5, 5)
    rfx_term <- rfx_coefs[rfx_group_ids] * rfx_basis
    noise_sd <- 1
    y <- mu_X + tau_X*Z + rfx_term + rnorm(n, 0, noise_sd)
    test_set_pct <- 0.2
    n_test <- round(test_set_pct*n)
    n_train <- n - n_test
    test_inds <- sort(sample(1:n, n_test, replace = FALSE))
    train_inds <- (1:n)[!((1:n) %in% test_inds)]
    X_test <- X[test_inds,]
    X_train <- X[train_inds,]
    Z_test <- Z[test_inds]
    Z_train <- Z[train_inds]
    pi_test <- pi_X[test_inds]
    pi_train <- pi_X[train_inds]
    mu_test <- mu_X[test_inds]
    mu_train <- mu_X[train_inds]
    tau_test <- tau_X[test_inds]
    tau_train <- tau_X[train_inds]
    rfx_group_ids_test <- rfx_group_ids[test_inds]
    rfx_group_ids_train <- rfx_group_ids[train_inds]
    rfx_basis_test <- rfx_basis[test_inds]
    rfx_basis_train <- rfx_basis[train_inds]
    y_test <- y[test_inds]
    y_train <- y[train_inds]
    
    # Run a BCF model with only GFR
    general_param_list <- list(num_chains = 1, keep_every = 1)
    bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                     propensity_train = pi_train, X_test = X_test, Z_test = Z_test,  
                     rfx_group_ids_train = rfx_group_ids_train, 
                     rfx_group_ids_test = rfx_group_ids_test, 
                     rfx_basis_train = rfx_basis_train, 
                     rfx_basis_test = rfx_basis_test, 
                     propensity_test = pi_test, num_gfr = 10, num_burnin = 0, 
                     num_mcmc = 0, general_params = general_param_list)
    
    # Save to JSON string
    bcf_model_json_string <- saveBCFModelToJsonString(bcf_model)
    
    # Run a new BCF chain from the existing (X)BCF model
    general_param_list <- list(num_chains = 3, keep_every = 5)
    expect_no_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test,  
                         rfx_group_ids_train = rfx_group_ids_train, 
                         rfx_group_ids_test = rfx_group_ids_test, 
                         rfx_basis_train = rfx_basis_train, 
                         rfx_basis_test = rfx_basis_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, previous_model_json = bcf_model_json_string, 
                         previous_model_warmstart_sample_num = 1, 
                         general_params = general_param_list)
    )
})

test_that("Multivariate Treatment MCMC BCF", {
    skip_on_cran()
    
    # Generate simulated data
    n <- 100
    p <- 5
    X <- matrix(runif(n*p), ncol = p)
    mu_X <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (-7.5) + 
            ((0.25 <= X[,1]) & (0.5 > X[,1])) * (-2.5) + 
            ((0.5 <= X[,1]) & (0.75 > X[,1])) * (2.5) + 
            ((0.75 <= X[,1]) & (1 > X[,1])) * (7.5)
    )
    pi_X_1 <- (
        ((0 <= X[,1]) & (0.25 > X[,1])) * (0.2) + 
        ((0.25 <= X[,1]) & (0.5 > X[,1])) * (0.4) + 
        ((0.5 <= X[,1]) & (0.75 > X[,1])) * (0.6) + 
        ((0.75 <= X[,1]) & (1 > X[,1])) * (0.8)
    )
    pi_X_2 <- (
        ((0 <= X[,2]) & (0.25 > X[,2])) * (0.8) + 
        ((0.25 <= X[,2]) & (0.5 > X[,2])) * (0.4) + 
        ((0.5 <= X[,2]) & (0.75 > X[,2])) * (0.6) + 
        ((0.75 <= X[,2]) & (1 > X[,2])) * (0.2)
    )
    pi_X <- cbind(pi_X_1, pi_X_2)
    tau_X_1 <- (
        ((0 <= X[,2]) & (0.25 > X[,2])) * (0.5) + 
        ((0.25 <= X[,2]) & (0.5 > X[,2])) * (1.0) + 
        ((0.5 <= X[,2]) & (0.75 > X[,2])) * (1.5) + 
        ((0.75 <= X[,2]) & (1 > X[,2])) * (2.0)
    )
    tau_X_2 <- (
        ((0 <= X[,3]) & (0.25 > X[,3])) * (-0.5) + 
        ((0.25 <= X[,3]) & (0.5 > X[,3])) * (-1.5) + 
        ((0.5 <= X[,3]) & (0.75 > X[,3])) * (-1.0) + 
        ((0.75 <= X[,3]) & (1 > X[,3])) * (0.0)
    )
    tau_X <- cbind(tau_X_1, tau_X_2)
    Z_1 <- as.numeric(rbinom(n, 1, pi_X_1))
    Z_2 <- as.numeric(rbinom(n, 1, pi_X_2))
    Z <- cbind(Z_1, Z_2)
    noise_sd <- 1
    y <- mu_X + rowSums(tau_X*Z) + rnorm(n, 0, noise_sd)
    test_set_pct <- 0.2
    n_test <- round(test_set_pct*n)
    n_train <- n - n_test
    test_inds <- sort(sample(1:n, n_test, replace = FALSE))
    train_inds <- (1:n)[!((1:n) %in% test_inds)]
    X_test <- X[test_inds,]
    X_train <- X[train_inds,]
    Z_test <- Z[test_inds,]
    Z_train <- Z[train_inds,]
    pi_test <- pi_X[test_inds,]
    pi_train <- pi_X[train_inds,]
    mu_test <- mu_X[test_inds]
    mu_train <- mu_X[train_inds]
    tau_test <- tau_X[test_inds,]
    tau_train <- tau_X[train_inds,]
    y_test <- y[test_inds]
    y_train <- y[train_inds]
    
    # 1 chain, no thinning
    general_param_list <- list(num_chains = 1, keep_every = 1)
    expect_error(
        bcf_model <- bcf(X_train = X_train, y_train = y_train, Z_train = Z_train, 
                         propensity_train = pi_train, X_test = X_test, Z_test = Z_test, 
                         propensity_test = pi_test, num_gfr = 0, num_burnin = 10, 
                         num_mcmc = 10, general_params = general_param_list)
    )
})
Any scripts or data that you put into this service are public.
stochtree documentation built on April 4, 2025, 2:11 a.m.
rdrr.io home R language documentation Run R code online
CRAN packages Bioconductor packages R-Forge packages GitHub packages
Note that we can't provide technical support on individual packages. You should contact the package authors for that.
stochtree
Stochastic Tree Ensembles (XBART and BART) for Supervised Learning and Causal Inference

tests/testthat/test-bcf.R
In stochtree: Stochastic Tree Ensembles (XBART and BART) for Supervised Learning and Causal Inference

Try the stochtree package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

stochtree Stochastic Tree Ensembles (XBART and BART) for Supervised Learning and Causal Inference

tests/testthat/test-bcf.R In stochtree: Stochastic Tree Ensembles (XBART and BART) for Supervised Learning and Causal Inference

Try the stochtree package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

stochtree
Stochastic Tree Ensembles (XBART and BART) for Supervised Learning and Causal Inference

tests/testthat/test-bcf.R
In stochtree: Stochastic Tree Ensembles (XBART and BART) for Supervised Learning and Causal Inference