test_weights_SE.R
In FactorHet: Estimate Heterogeneous Effects in Factorial Experiments Using Grouping and Sparsity

context("Test weights & SEs")

if (isTRUE(as.logical(Sys.getenv("CI")))){
  # If on CI
  NITER <- 2
  env_test <- "CI"
}else if (!identical(Sys.getenv("NOT_CRAN"), "true")){
  # If on CRAN
  NITER <- 2
  env_test <- "CRAN"
  set.seed(8)
}else{
  # If on local machine
  NITER <- 2000
  env_test <- 'local'
}

test_that('Standard errors work with weights (K=1)', {
  
  dta <- data.frame(
    state = sample(state.name[1:4], 1000, replace = T),
    letter = sample(letters[1:3], 1000, replace = T)
  )
  
  dta$group <- rep(sample(1:250, 500, replace = T), each = 2)
  dta$task <- rep(1:500, each = 2)
  dta$prof <- as.vector(sapply(1:500, FUN=function(i){c('l', 'r')[sample(2)]}))
  dta$y <- as.vector(sapply(1:500, FUN=function(i){sample(0:1)}))
  dta$mod <- runif(500, -1, 1)[dta$group]
  
  wgt <- abs(rcauchy(n = 500))
  wgt[wgt > median(wgt) * 500] <- median(wgt) * 500
  dta$weights <- wgt[dta$group]
  
  simple_logit <- FactorHet(formula = y ~ state * letter, design = dta,
                            K = 1, lambda = 0)
  weight_logit <- FactorHet(formula = y ~ state * letter, design = dta,
    K = 1, lambda = 0, weights = ~ weights,
    control = FactorHet_control(tolerance.logposterior = 1e-8, 
                                return_data = TRUE))
  
  X <- weight_logit$internal_parameters$data$X
  y <- weight_logit$internal_parameters$data$y  
  beta <- weight_logit$parameters$nullspace_beta
  weights <- weight_logit$internal_parameters$weights$weights
  
  p <- plogis(as.vector(X %*% beta))
  
  manual_weight <- solve(t(X) %*% Diagonal(x = p * (1-p) * weights) %*% X)
  fit_glm <- suppressWarnings(
    glm(y ~ 0 + as.matrix(X), family = binomial(), weights = weights)  
  )
  expect_equivalent(coef(fit_glm), as.vector(beta), tol = 1e-5, scale = 1)
  
  vcov_glm <- vcov(fit_glm)
  expect_equivalent(vcov_glm, as.matrix(manual_weight), tol = 1e-5, scale = 1)
  
  basis_M <- weight_logit$internal_parameters$data$basis_M
  vcov_analytic <- basis_M %*% manual_weight %*% t(basis_M)
  expect_equivalent(vcov(weight_logit), as.matrix(vcov_analytic))
  
  #Does it agree with Hessian of log-posterior with ridge?
  est_simple <- FactorHet(formula = y ~ state + letter, design = dta, K = 1, 
                          lambda = 0, moderator = ~ mod,
                          weights = ~ weights,
                          control = FactorHet_control(prior_var_beta = 1/3, 
                                                      log_method = 'standard',
                                                      return_data = TRUE))  
  pred_simple <- predict(est_simple)
  X <- est_simple$internal_parameters$data$X
  basis_M <- est_simple$internal_parameters$data$basis_M
  vcov_cons <- solve(t(X) %*% Diagonal(x = est_simple$internal_parameters$weights$weights * pred_simple * (1-pred_simple)) %*% X +
                       t(basis_M) %*% sparse_diag(c(0,rep(3, nrow(basis_M) - 1))) %*% (basis_M))
  vcov_analytic <- basis_M %*% vcov_cons %*% t(basis_M)
  expect_equivalent(vcov(est_simple), as.matrix(vcov_analytic))
})

test_that('Standard errors work with weights (K=3)', {
  
  skip_on_cran()
  skip_on_ci()
  
  N <- 1000
  K <- 3
  dta <- data.frame(
    state = sample(state.name[1:4], N, replace = T),
    letter = sample(letters[1:5], N, replace = T)
  )
  
  dta$group <- rep(sample(1:250, 500, replace = T), each = 2)
  dta$task <- rep(1:500, each = 2)
  dta$prof <- as.vector(sapply(1:500, FUN=function(i){c('l', 'r')[sample(2)]}))
  dta$y <- as.vector(sapply(1:500, FUN=function(i){sample(0:1)}))
  dta$mod <- runif(500, -1, 1)[dta$group]
  dta$mod2 <- sample(LETTERS[1:5], 500, replace = T)[dta$group]
  
  p1 <- plogis(runif(5, 0 , 1)[match(dta$state, state.name[1:5])] + runif(5, -3, -2)[match(dta$letter, letters)])
  p2 <- plogis(runif(5, -1 , 1)[match(dta$state, state.name[1:5])] + runif(5, -1, 1)[match(dta$letter, letters)]) 
  
  dta$y1 <- unlist(lapply(split(p1, rep(1:500, each = 2)), FUN=function(i){sample(0:1, 2, prob = i)}))
  dta$y2 <- unlist(lapply(split(p2, rep(1:500, each = 2)), FUN=function(i){sample(0:1, 2, prob = i)}))
  dta$placeholder <- unsplit(lapply(split(rnorm(10)[match(dta$mod2, unique(dta$mod2))], dta$group), FUN=function(i){rep(rbinom(1, 1, plogis(i[1])), length(i))}), dta$group)
  dta$y <- ifelse(dta$placeholder == 1, dta$y1, dta$y2)
  dta$weights <- abs(rt(500, df = 2.5))[dta$group]
  
  # Does it agree with standard LASSO estimates
  
  # Seems to work for K = 1, RIDGE
  # Seems to work for K = {1, 2, 3}, LASSO
  
  est_simple <- FactorHet(formula = y ~ state + letter, design = dta, K = K, 
                          lambda = 1e-3, moderator = ~ mod + mod2,
                          weights = ~ weights,
                          control = FactorHet_control(
                            prior_var_beta = Inf, single_intercept = TRUE,
                            log_method = 'standard',
                            return_data = TRUE))  
  
  group_mapping <- sparseMatrix(i = 1:nrow(est_simple$internal_parameters$data$X), 
                                j = match(est_simple$internal_parameters$group$group_mapping, 
                                          est_simple$internal_parameters$group$unique_groups), x = 1)
  
  #beta, pi, phi
  check_args <- list(
    X = est_simple$internal_parameters$data$X,
    y = est_simple$internal_parameters$data$y,
    W = est_simple$internal_parameters$data$W,
    weights_W = est_simple$internal_parameters$data$weights_W,
    group_mapping = group_mapping,
    Fmatrix = est_simple$internal_parameters$data$Fmatrix,
    E.prob = NA,
    ridge_phi = 1/est_simple$internal_parameters$control$prior_var_phi,
    ridge_beta = 0,
    adaptive_weight = est_simple$internal_parameters$adaptive_weight,
    gamma = est_simple$parameters$gamma,
    lambda = est_simple$parameters$eff_lambda,
    separate = TRUE
  )
  
  expect_true(!all(check_args$weights_W == 1))
  
  flat_beta <- est_simple$parameters$nullspace_beta
  flat_phi <- est_simple$parameters$phi
  if (K == 1){
    flat_phi <- matrix(nrow = 0, ncol = 0)
  }
  flat_par <- safe_flat_par <- c(
    flat_beta[nrow(flat_beta), 1], 
    as.vector(flat_beta[-nrow(flat_beta),]),
    as.vector(t(flat_phi[-1,,drop=F]))
  )
  
  counter <- 0
  check_args$kern_epsilon <- 1e-4
  ll_numderiv <- function(par, K, other_args, pos = 1){
    counter <<- counter + 1
    if (counter %% 500 == 0){message(counter, appendLF = FALSE)}
    mu <- par[1]
    par <- par[-1]
    beta <- matrix(par[seq_len(K * (ncol(other_args$X) - 1))], ncol = K)
    beta <- rbind(beta, mu)
    if (K != 1){
      phi <- matrix(par[-seq_len(K * (ncol(other_args$X) - 1))], byrow = T,
                    nrow = (K-1))
      phi <- rbind(0, phi)
      pi <- colSums(Diagonal(x = other_args$weights_W/sum(other_args$weights_W)) %*% 
                      softmax_matrix(other_args$W %*% t(phi)))
    }else{
      phi <- NA
      pi <- 1
    }
    return(do.call('evaluate_loglik', 
                   c(list(beta = beta, phi = phi, pi = pi), other_args))[pos])
  }  
  
  direct_optim <- optim(fn = ll_numderiv, par = flat_par, K = K, 
                        control = list(fnscale = -1, reltol = 0, abstol = 0), method = 'BFGS',
                        other_args = check_args)
  
  flat_par <- direct_optim$par
  
  recons_par <- direct_optim$par
  recons_mu <- recons_par[1]
  recons_par <- recons_par[-1]
  recons_beta <- matrix(recons_par[seq_len(K * (ncol(check_args$X) - 1))], ncol = K)
  recons_beta <- rbind(recons_beta, recons_mu)
  if (K != 1){
    recons_phi <- matrix(recons_par[-seq_len(K * (ncol(check_args$X) - 1))], byrow = TRUE, nrow = (K-1))
    recons_phi <- rbind(0, recons_phi)
    recons_pi_bar <- colMeans(softmax_matrix(check_args$W %*% t(recons_phi)))
  }else{
    recons_phi <- matrix(0, nrow = 1, ncol = 1)
    recons_pi_bar <- 1
  }
  
  jacobian <- getFromNamespace('jacobian', 'numDeriv')
  hessian <- getFromNamespace('hessian', 'numDeriv')
  num_grad <- as.vector(jacobian(func = ll_numderiv, 
                                 x = flat_par, K = K, other_args = check_args))
  num_hessian <- optimHess(fn = ll_numderiv, 
                           par = flat_par, K = K, other_args = check_args)
  num_hessian_numd <- hessian(func = ll_numderiv, 
                              x = flat_par, K = K, other_args = check_args)
  # Check gradient is basically stationary
  expect_lte(max(abs(num_grad)), 1e-3)
  
  copy_est <- est_simple
  copy_est$parameters$beta <- NA
  copy_est$parameters$pi <- recons_pi_bar
  copy_est$parameters$phi <- recons_phi
  copy_est$parameters$nullspace_beta <- recons_beta
  
  vcov_analytical <- estimate.vcov(copy_est, return_raw_se = TRUE)
  vcov_numerical <-  -solve(num_hessian)
  vcov_numerical_numd <- -solve(num_hessian_numd)
  
  # Tests from "test_SE.R" but for weighted versions  
  cor_vcov <- cor(as.vector(vcov_analytical$vcov), as.vector(vcov_numerical))
  expect_gte(cor_vcov, 0.999)
  test_lm <- lm(as.vector(vcov_analytical$vcov) ~ as.vector(vcov_numerical))
  expect_equivalent(coef(test_lm), c(0, 1), tol = 1e-3, scale = 1)
  
  # Get the variance and the percent difference
  var_analytical <- diag(vcov_analytical$vcov)
  var_numerical <- diag(vcov_numerical)
  range_diff_var <- range(100 * abs(var_numerical - var_analytical)/var_numerical)
  expect_true(all(range_diff_var > 0))
  expect_lte(range_diff_var[2], 2)
  
})

Any scripts or data that you put into this service are public.

FactorHet documentation built on April 4, 2025, 5:44 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

FactorHet
Estimate Heterogeneous Effects in Factorial Experiments Using Grouping and Sparsity

tests/testthat/test_weights_SE.R
In FactorHet: Estimate Heterogeneous Effects in Factorial Experiments Using Grouping and Sparsity

Try the FactorHet package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

FactorHet Estimate Heterogeneous Effects in Factorial Experiments Using Grouping and Sparsity

tests/testthat/test_weights_SE.R In FactorHet: Estimate Heterogeneous Effects in Factorial Experiments Using Grouping and Sparsity

Try the FactorHet package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

FactorHet
Estimate Heterogeneous Effects in Factorial Experiments Using Grouping and Sparsity

tests/testthat/test_weights_SE.R
In FactorHet: Estimate Heterogeneous Effects in Factorial Experiments Using Grouping and Sparsity