jmmi_col: Funciones que facilitan la limpieza de los datos obtenidos en la misión REACH Colombia

Documented in kobo.df_to_r

#' Kobo dataframe to R
#'
#' La funcion toma un dataframe de kobo y lo cambia de name a label
#'
#' @param encuesta El parametro encuesta sera el dataframe de kobo
#' @param choices El parametro choices es la hoja Choices de la herramienta Kobo
#' @param survey El parametro survey es la hoja Survey de la herramienta Kobo
#' @param label_name El parametro label_name es el nombre de la etiqueta a la que se quiere transformar los datos
#'
#' @return - Un dataframe de la encuesta y la convierte de numeros a los labels
#' @export
#'
#' @examples survey <- read_excel("Input/KOBO_ABA_BOA VISTA - ANDRÉ_revGN_v6_GN.xlsx", sheet = "survey")
#' @examples choices <- read_excel("Input/KOBO_ABA_BOA VISTA - ANDRÉ_revGN_v6_GN.xlsx", sheet = "choices")
#' @examples df <-  read_excel("Input/REACH_BRA_ABAConsolidadoCleaning_20220906.xlsm", sheet = "Raw Data")

#'
#' @examples base <- kobo.df_to_r(df, choices, survey, "label")
#' @examples base <- kobo.df_to_r(encuesta = df, choices = choices, survey = survey, label_name = "label")

kobo.df_to_r <- function(encuesta, choices, survey, label_name = "label"){
  choices = choices %>% mutate(concated_column = paste(list_name, name, sep = ''))

  xls1 = encuesta  # Cambiar a i
  #pasar todo a character
  xls1 <- setNames(data.frame(lapply(xls1, as.character)),
                   colnames(xls1))

  #pasar los NA a *****
  xls1 <- xls1 %>% mutate(across(everything(), ~replace_na(.x, "-----")))
  #reemplazar los nombres de las variables
  colnames(xls1) = gsub("/", " ", colnames(xls1))

  #xls1 <- xls1 %>% rename_all(funs(str_replace_all(., "/", " ")))

  dataset <- data.frame(Type = character(),
                        Choice = character(),
                        Nombre = character(),
                        Etiqueta = character())

  ##Colocar los nombres de la encuesta en fila
  for (j in 1:ncol(xls1)) {
    dataset <- dataset %>% add_row(Nombre = names(xls1[j]))
  }


  #Colocar el tipo de dato que es para despues obterner los labels
  for (a in 1:nrow(dataset)) {
    for (b in 1:nrow(survey)){
      new_name <- str_split(dataset$Nombre[a], " ")
      new_name <- new_name[[1]][1]
      if (!is.na(survey$name[b])) {
        if (new_name == survey$name[b]) {
          dataset$Type[a] <- survey$type[b]
        }
      }
    }
  }

  # Aviso
  print("1/4 del script se ha ejecutado...")

  ##Colocar choice
  for (i in 1:nrow(dataset)) {
    new_name <- str_split(dataset$Type[i], " ")
    new_name <- new_name[[1]][2]
    dataset$Choice[i] <- new_name
  }

  ##Tipo select_one o select_multiple
  for (i in 1:nrow(dataset)) {
    if (str_detect(replace_na(dataset$Type[i], ""), "select_multiple")){
      dataset$Type[i] <- "select_multiple"
    }else if(str_detect(replace_na(dataset$Type[i], ""), "select_one")){
      dataset$Type[i] <- "select_one"
    }else {
      dataset$Type[i] <- ""
    }
  }

  ##Colocar los dato del select_one para despues pasar de numero a el valor
  for (i in 1:ncol(xls1)){
    for (j in 1:nrow(dataset)){
      if (names(xls1[i]) == dataset$Nombre[j] & dataset$Type[j] == "select_one"){
        xls1[[i]] <- paste(dataset$Choice[j], xls1[[i]], sep = "")
      }
    }
  }

  # Aviso
  print("2/4 del script se ha ejecutado...")

  ## Colocar los dato del select_multiple para despues pasar de numero a el valor
  for (i in 1:ncol(xls1)){
    for (j in 1:nrow(dataset)){
      if (names(xls1[i]) == dataset$Nombre[j] & dataset$Type[j] == "select_multiple" & !(names(xls1[i]) %ilike% " ")){
        xls1[[i]] <- paste(dataset$Choice[j], xls1[[i]], sep = "")
      }
    }
  }

  # Completar los select_multiple, cambiar los espacios por el titulo
  for (i in 1:ncol(xls1)){
    for (j in 1:nrow(dataset)){
      if (names(xls1[i]) == dataset$Nombre[j] & dataset$Type[j] == "select_multiple" & !(names(xls1[i]) %ilike% " ")){
        # Se separa con // para hacerlo mas legible
        xls1[[i]] <- gsub(" ", paste("  // ", dataset$Choice[j], sep = ""), xls1[[i]])
      }
    }
  }


  ##Quitar los datos que tienen el nombre con NA
  for (i in names(xls1)) {
    xls1 <- xls1 %>% mutate(!!sym(i) := case_when(str_detect(!!sym(i), "-----") ~ NA_character_,
                                                  TRUE ~ !!sym(i)))
  }

  # Pasar los select multiples de numeros a los valores del cuestionario
  multiple <- dataset %>% filter(Type == "select_multiple" & !(Nombre %ilike% " "))
  if (nrow(multiple > 0)) {
    for (i in 1:nrow(multiple)) {
      filtro <- choices %>% filter(list_name == multiple[["Choice"]][i])
      xls1[[multiple[["Nombre"]][i]]] <- paste(xls1[[multiple[["Nombre"]][i]]], " ", sep = "")
      for (z in 1:nrow(filtro)){
        xls1[[multiple[["Nombre"]][i]]] <- gsub(paste(filtro[["concated_column"]][z], " ", sep = ""), paste(filtro[[label_name]][z], "", sep = "") , xls1[[multiple[["Nombre"]][i]]])
        # Ajustar los "NA " creados a NA
        xls1[[multiple[["Nombre"]][i]]] <- gsub("NA ", NA, xls1[[multiple[["Nombre"]][i]]])
      }
    }
  } else {
    print("Este DataFrame no tiene opciones multiples")
  }



  # Aviso
  print("3/4 del script se ha ejecutado...")

  ## Pasar los datos restantes de numeros a los valores del cuestionario
  multiple <- dataset %>% filter(Type == "select_one")
  for (i in 1:nrow(multiple)) {
    x <- round((i / nrow(multiple) * 100), 2)
    if (x %% 5 == 0) {
      print(paste(x, "% de progreso...", sep = ""))
    }

    filtro <- choices %>% filter(list_name == multiple[["Choice"]][i])
    xls1[[multiple[["Nombre"]][i]]] <- paste(xls1[[multiple[["Nombre"]][i]]], " ", sep = "")
    for (z in 1:nrow(filtro)){
      xls1[[multiple[["Nombre"]][i]]] <- gsub(paste(filtro[["concated_column"]][z], " ", sep = ""), paste(filtro[[label_name]][z], "", sep = "") , xls1[[multiple[["Nombre"]][i]]])
      # Ajustar los "NA " creados a NA
      xls1[[multiple[["Nombre"]][i]]] <- gsub("NA ", NA, xls1[[multiple[["Nombre"]][i]]])
    }
  }

  # Mach mas rapido pero si no se tienen todos los valores no sirve mucho
  #for (i in names(xls1)) {
  #  if(sum(is.na(choices[[label_name]][match(xls1[[i]],choices$concated_column)])) < ncol(xls1)){
  #    xls1[i] <- choices[[label_name]][match(xls1[[i]],choices$concated_column)]
  #  }
  #}

  #regresar los datos de espacio a /
  xls1 <- xls1 %>% rename_all(funs(str_replace_all(., " ", "/")))


  ##Regrese la lista con los datos
  cat("\n")
  print("Funcion ejecutada con exito...")
  return(xls1)
}

jhoneder1993/jmmi_col documentation built on July 27, 2023, 8:10 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

jhoneder1993/jmmi_col
Funciones que facilitan la limpieza de los datos obtenidos en la misión REACH Colombia

R/kobo.df_to_r.R
In jhoneder1993/jmmi_col: Funciones que facilitan la limpieza de los datos obtenidos en la misión REACH Colombia

Defines functions kobo.df_to_r

Documented in kobo.df_to_r

R Package Documentation

Browse R Packages

We want your feedback!

jhoneder1993/jmmi_col Funciones que facilitan la limpieza de los datos obtenidos en la misión REACH Colombia

R/kobo.df_to_r.R In jhoneder1993/jmmi_col: Funciones que facilitan la limpieza de los datos obtenidos en la misión REACH Colombia

Defines functions kobo.df_to_r

Documented in kobo.df_to_r

R Package Documentation

Browse R Packages

We want your feedback!

jhoneder1993/jmmi_col
Funciones que facilitan la limpieza de los datos obtenidos en la misión REACH Colombia

R/kobo.df_to_r.R
In jhoneder1993/jmmi_col: Funciones que facilitan la limpieza de los datos obtenidos en la misión REACH Colombia