R/treatment_assign.R
In RCT: Assign Treatments, Power Calculations, Balances, Impact Evaluation of Experiments

Documented in ntile_label treatment_assign

#' treatment_assign() carries out robust treatment assignment by strata/blocks
#' @param data A data.frame, tibble or data.table
#' @param share_control share of the observations assigned to control group
#' @param n_t Number of treatments groups
#' @param strata_varlist vector of categorical variables to form the strata/blocks for random assignment. 
#' Should be in the form of vars(var1, var2, ...)
#' @param missfits How to handle the misfits. Default is "global". See Carril (2016) for details.
#' @param share_ti The share of each treatment group. If NULL (Default), each treatment group will 
#' have equal share.
#' @param seed A number used to set.seed(). 
#' @param key The key identifier column of data. 
#' @return A list: "data" = the data with key, treat, strata, misfit column., 
#' "summary_strata" = A summary tibble with the membership of each strata and its size.
#' @examples 
#' data<-data.frame(key = c(1:1000), 
#'                  ing_quartile = rep(c("Q1", "Q2", "Q3", "Q4"), each = 250), 
#'                  age_quartile = rep(c("Q1", "Q2", "Q3", "Q4"), times = 250))
#' assigment<-treatment_assign(data = data, share_control = 0.1, n_t = 3,
#'                             strata_varlist = dplyr::vars(ing_quartile, 
#'                             age_quartile), missfits = "strata", 
#'                             seed = 1990, key = "key")
#' table(data$treat, useNA = "ifany")
#' prop.table(table(data$treat, useNA = "ifany"))
#' @details This function creates a variable that indicates the treatment status. The random 
#' assignment is made by strata/blocks. It can handle equal or unequal treatment shares. 
#' Finally, it has three methods available to handle misfits (same as randtreat in STATA):
#' "global": assigning the observations that couldn't be randomly assigned globally, 
#' "strata": assigning the observations that couldn't be randomly assigned by strata,
#' "NA": set the the treat observations that couldn't be randomly assigned to NA.
#' @export
#' @importFrom magrittr %>%
#' @importFrom ggplot2 vars
#' @importFrom rlang :=


treatment_assign <- function(data,
                             share_control,
                             n_t = 2,
                             strata_varlist,
                             missfits = c("global", "NA", "strata"),
                             seed = 1990,
                             share_ti = rep(1/n_t - share_control/n_t, times = n_t),
                             key) {
    
    
    # Arrange by key
    data <- data %>% dplyr::arrange(!!rlang::sym(key))
    
    # Creating a random variable
    random<-NULL
    set.seed(seed)
    data$random <- stats::runif(nrow(data))
    
    #Strata size
    n_strata<-NULL
    strata<-NULL
    
    data <-
        data %>%
        dplyr::group_by(!!!strata_varlist) %>%
        dplyr::mutate(n_strata := dplyr::n())
    
    # strata id 
    data$strata<-dplyr::group_indices(data)

    # Row number on each strata
    strata_index<-NULL
    data <- data %>%
        dplyr::group_by(strata) %>%
        dplyr::arrange(strata, random) %>%
        dplyr::mutate(strata_index = dplyr::row_number())
    
    
    # Missfits 
    
    # Minimo comun multiplo de los denominadores de share_ti y share_control 
    # share control 
    denominator_control<-as.numeric(stringr::str_split(attr(MASS::fractions(share_control), "fracs"), pattern = "/")[[1]][2])
    denominator_treat<-as.numeric(stringr::str_split(attr(MASS::fractions(share_ti), "fracs"), pattern = "/")[[1]][2])
    
    divisor<-pracma::Lcm(denominator_control, denominator_treat)
    
    row_missfit<-NULL
    num_missfits<-NULL
    missfit <- NULL
    data <- 
        data %>%
        dplyr::group_by(strata) %>% 
        dplyr::mutate(missfit_strata = dplyr::if_else(n_strata %% divisor == 0 , 0, 1), 
                      num_missfits = n_strata %% divisor, 
                      row_missfit = max(strata_index) - num_missfits, 
                      missfit = dplyr::if_else(strata_index <= row_missfit, 0 , 1))
    
    # Strata summary
    n_missfits<-NULL
    resumen_strata <-
        data %>%
        dplyr::group_by(strata, !!!strata_varlist) %>%
        dplyr::summarise(n_strata := mean(n_strata), 
                         n_missfits := sum(missfit))
    
    
    # Primero asignamos sin missfits 
    
    data_missfits<- data %>% dplyr::filter(missfit == 1)
    data <-data %>% dplyr::filter(missfit == 0)
    
    
    #Strata size, recalculado
    data <-
        data %>%
        dplyr::group_by(strata) %>%
        dplyr::mutate(n_strata = dplyr::n())
    
    
    # Treatment sequence, if equal
    group_sequence  <- c(0,
                         share_control,
                         share_ti)
    
    group_sequence<-base::cumsum(group_sequence)

    treat<-NULL
    

    for (i in 1:(n_t+2)) {
        
        data$treat[data$strata_index/data$n_strata <= group_sequence[i+1] & 
                       data$strata_index/data$n_strata > group_sequence[i]]<-i-1
        
        
    }
    
    # Missfits treatment
    
    if(missfits == "NA") { 
        
        data_missfits$treat<-NA
        data <-dplyr::bind_rows(data, data_missfits)
        

    } else if (missfits == "global") {
        
        
        data_to_assign <- data_missfits %>% dplyr::ungroup()
        
        random2<-NULL
        
        data_to_assign$random2<-stats::runif(nrow(data_to_assign))
        
        
        data_to_assign <-
            data_to_assign %>%
            dplyr::arrange(random2) %>%
            dplyr::mutate(index = dplyr::row_number())
        

        for (i in 1:(n_t+2)) {
            
            data_to_assign$treat[data_to_assign$index/base::nrow(data_to_assign) <= group_sequence[i+1] & 
                                     data_to_assign$index/base::nrow(data_to_assign) > group_sequence[i]]<-i-1
            
            
        }
        
        data_to_assign$random2<-NULL
        data_to_assign$index<-NULL
        
        data<-dplyr::bind_rows(data, data_to_assign)
        
        
    }  else { 
        
        # En cada strata reasigno a los missfits 
        data_to_assign<-data_missfits
        data_to_assign$random2<-stats::runif(nrow(data_to_assign))
        
        data_to_assign<-
            data_to_assign %>% 
            dplyr::group_by(strata) %>% 
            dplyr::mutate(n_strata_missfit = dplyr::n())
        
        data_to_assign <-
            data_to_assign %>%
            dplyr::group_by(strata) %>%
            dplyr::arrange(strata, random2) %>%
            dplyr::mutate(index = dplyr::row_number())
        
        

        for (i in 1:(n_t+2)) {
            
            data_to_assign$treat[data_to_assign$index/data_to_assign$n_strata_missfit <= group_sequence[i+1] & 
                                     data_to_assign$index/data_to_assign$n_strata_missfit > group_sequence[i]]<-i-1
        }
        
        
        data_to_assign$random2<-NULL
        data_to_assign$index<-NULL
        
        data<-dplyr::bind_rows(data, data_to_assign)
        
    }
    
    n<-NULL
    tab_treat<-
        data %>% 
        dplyr::group_by(strata, treat) %>% 
        dplyr::tally() %>% 
        tidyr::pivot_wider(id_cols = strata, names_from = treat, values_from = n)
    
    resumen_strata<-
        dplyr::left_join(resumen_strata, tab_treat, by = 'strata')
    
    objetos<-list("summary_strata" = resumen_strata, "data" = data %>% dplyr::select(key, strata, treat, missfit))
    
    return(objetos)
    
    
}




#' ntile_label() ranks observations in n groups, with labels
#' @param var The variable wished to be ntile_label 
#' @param n rank the variable in n groups 
#' @param digits How many digits to include in the label 
#' @return A ordered factor vector of each n group. The value has the form of [min(n_i) - max(n_i)]
#' @examples 
#' data <- data.frame(y_1 = rbinom(n = 100, size = 1, prob = 0.3), 
#'                    y_2 = rnorm(n = 100, mean = 8, sd = 2))
#' data$y_1_2 <- ntile_label(data$y_1, n = 2, digits = 0) 
#' data$y_2_4 <- ntile_label(data$y_2, n = 4, digits = 1)
#' @details n_tile_label is very similar to ntile from dplyr. But n_tile_label creates
#' the n groups and then labels them. For each group i, the value of the ntile_label is 
#' [min(i) - max(i)].
#' @export

#' @importFrom magrittr %>%
ntile_label <- function(var, n, digits = 0) {
    
    secuencia<-seq(0, 1, by = 1/n)
    cuantiles <- base::round(stats::quantile(var, secuencia, na.rm = T), digits = digits)
    
    cuantiles2<-base::round(cuantiles[2:length(cuantiles)], digits = digits)
    label<-stringr::str_c("[", utils::head(cuantiles, -1), " a ", cuantiles2, "]")
    
    referencia<-dplyr::tibble(grupos = seq(1, n), 
                       label = label)
    
    data<-dplyr::tibble(var = var, 
                 grupos = dplyr::ntile(var, n))
    
    data <-
        dplyr::left_join(data, referencia, by  = "grupos")
    
    data <-
        data %>% 
        dplyr::mutate(label = forcats::fct_reorder(.f = label, .x = var))
    
    return(data$label)                      
}

Any scripts or data that you put into this service are public.

RCT documentation built on May 13, 2022, 9:06 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

RCT
Assign Treatments, Power Calculations, Balances, Impact Evaluation of Experiments

R/treatment_assign.R
In RCT: Assign Treatments, Power Calculations, Balances, Impact Evaluation of Experiments

Defines functions ntile_label treatment_assign

Documented in ntile_label treatment_assign

Try the RCT package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

RCT Assign Treatments, Power Calculations, Balances, Impact Evaluation of Experiments

R/treatment_assign.R In RCT: Assign Treatments, Power Calculations, Balances, Impact Evaluation of Experiments

Defines functions ntile_label treatment_assign

Documented in ntile_label treatment_assign

Try the RCT package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

RCT
Assign Treatments, Power Calculations, Balances, Impact Evaluation of Experiments

R/treatment_assign.R
In RCT: Assign Treatments, Power Calculations, Balances, Impact Evaluation of Experiments