Aviso preliminar
Esta plantilla está diseñada para la generación de "variables outcome" del proyecto Edad con Salud. Su objetivo es ayudar a automatizar las tareas de procesamiento de datos del proyecto.
Esta plantilla está basada en el documento Outcome variable generation guidelines.docx . Sin embargo, esta plantilla no sustituye a ese documento. Por favor, lee dicho documento para conocer todas las instrucciones y convenciones del proceso de generación de variables outcome de Edad con Salud.
Consideraciones generales
Puesto que nuestros datos son analizados por investigadores/as procedentes de distintas partes del mundo, todos los documentos deben estar en inglés.
El nombre de este archivo debe tener la siguiente estructura:
"Description_
Si se trata de una variable que ya estaba generada en evaluaciones anteriores/otras cohortes, puedes adaptar la información de ese documento. En ese caso, por favor, revisa cuidadosamente que la información contenida se ajusta a las particularidades de los datos.
# Activar los paquetes que R necesita para ejecutar el código: library(Statamarkdown) # Ruta al ejecutable de Stata (Ejecuta `sysdir` en Stata para encontrar la ruta) ## TODO: sustituir '<path\to\>' por la ubicación de Stata ## (ejecutar `sysdir` en Stata) y descomentar línea 62, ## o eliminar linea 62: # STATA_PATH <- r"(<path\to\>StataSE-64.exe)" # Opciones de configuración de las salidas de R y Stata: options(width = 88) # Ancho de salida de texto en R knitr::opts_chunk$set( # Para todos los 'chunks' de código: ## TODO: Descomentar si hace falta # engine.path = list(stata = STATA_PATH), echo = FALSE, # - No muestra la sintaxis en el documento results = 'hide',# - Omite los resultados de ejecutar la sintaxis cleanlog = TRUE, # - Omite repetir sintaxis en resultados de Stata collectcode = TRUE, # - Reutiliza el código de Stata de 'chunks' anteriores comment = '' # - No añade ningún prefijo a los resultados ) TEST <- params$test DOUBLE_CODING <- params$`double-coding` & TEST
Aquí debes incluir una tabla con los datos principales de todas la/s variable/s finales generada/s. Esto es, el nombre de la/s variable/s (tal y como aparece/n en la base de datos), la/s etiqueta/s, el formato (discreta, continua, nominal, ordinal, binaria) y los valores posibles (e.g., rango para continuas, opciones de respuesta para variables categóricas).
En esta tabla debes incluir la variable principal, así como las transformaciones pertinentes asociadas a esta variable, como ocurre con el ejemplo anterior. En el caso de que la/s variable/s generada/s que requiera/n la creación previa de otras variables, solo se incluirán aquellas que pueden resultar clave para entender o analizar la variable final. Por ejemplo, si creas una variable a partir de otra existente en la que eliminas casos con datos inválidos o modificas las etiquetas, no es necesario que incluyas esta información en este punto (tampoco en la base de datos). Los/as investigadores/as podrán verlo en el algoritmo. En caso que tengas dudas sobre qué variables incluir en este punto, por favor, pregunta a alguno de los/as compañeros responsables del proyecto.
En la etiqueta de la/s variable/s generadas, por favor incluye información
acerca de la cohorte y la evaluación de la que se trata. El patrón es un
sufijo como (c
Ejemplos: (c2011_w1), (c2019_w3), (c2019_wCOVID). "w1" se correspondería con la primera evaluación (línea base).
+--------------------+------------------------------------------+------------+----------------------+
| Main variable name | Label | Format | Code |
+:===================+:=========================================+:===========+:=====================+
|
Por favor, incluye aquí una breve descripción de la variable o constructo que estás trabajando. Qué significa o qué evalúa esa variable y por qué es importante. Incluye las referencias bibliográficas necesarias.
Este apartado es complementario al siguiente. Trata de describir, de forma clara y concisa, cómo has generado la variable. El objetivo de esta sección es doble. Por un lado, que sirva de apoyo para los/as investigadores/as que pudieran no estar familiarizados con el código utilizado para generar la/s variable/s (e.g., R, Stata). Por otro, facilitar la información suficiente para describir adecuadamente la/s variable/s en los artículos científicos.
Si se trata de variable/s que ya se había/n generado en ocasiones anteriores (e.g., evaluaciones o cohortes distintas), por favor, documenta las potenciales particularidades o modificaciones que realices (e.g., versión reducida, detección de errores).
Como criterio general, esta sección debería ser suficiente para entender cómo ha de generarse la variable sin necesidad de entender la sintaxis.
Aquí debes incluir el algoritmo o código empleado para generar la/s variable/s. Es fundamental que revises minuciosamente esta sección. Cualquier investigador/a debería poder generar la/s variable/s y obtener los mismos resultados. Por favor, indica también el programa utilizado (e.g., Stata, R), si bien ten en cuenta que el consenso es utilizar Stata. Incluye también una pequeña tabla con los descriptivos principales de esta/s variable/s (i.e., n, frecuencia absoluta y relativa, rango, media...).
``{stata load-data}
* TODO: Descomentar linea correspondiente a la base de datos maestra a utilizar
* TODO: Comprobar que la ruta de origen coincide con la localización de
DB`
use "~\UAM\Marta Miret Garcia - Bases de datos maestras Edad con Salud\Ola_1_Linea_base\All_COURAGE_VFINAL.dta"
Cohorte 2011, ola 2:
use "~\UAM\Marta Miret Garcia - Bases de datos maestras Edad con Salud\Ola_2\20150916 Database COURAGE wave 1.dta"
Cohorte 2011, ola 3:
use "~\UAM\Marta Miret Garcia - Bases de datos maestras Edad con Salud\Ola_3\Cohorte_2011\FINAL\20190208_PES16028242_Seguimiento_final_completo_V6.dta"
Cohorte 2011, ola 4:
use "~\UAM\Marta Miret Garcia - Bases de datos maestras Edad con Salud\Ola_4\Cohorte 2011\rawdata_c2011w4.dta"
Cohorte 2019, linea base:
use "~\UAM\Marta Miret Garcia - Bases de datos maestras Edad con Salud\Ola_3\Cohorte_2019\rawdata_c2019w1.dta"
Cohorte 2019, ola post-confinamiento:
```{stata generate-outcomes, echo=!DOUBLE_CODING} * TODO: Escribir aquí la sintaxis de generación de las variables
Otras consideraciones
- El **número de participantes (n) que debe aparecer en cada base de datos** debe ser correspondiente con aquella que aparece en la base de datos maestra u original. Para la **base de datos de la muestra completa serán 3002 participantes**. En el caso de la **muestra pre-confinamiento serán 1935 participantes**. - Es recomendable que revises los descriptivos de la/s variable/s generadas. De esta forma podrás detectar posibles errores (e.g., un porcentaje de datos perdidos que no responde a lo esperado; una prevalencia de x patología muy superior o inferior a lo que la evidencia científica señala).
``{stata descriptives, cleanlog=FALSE, collectcode=FALSE, results='markup', include=!DOUBLE_CODING}
* TODO: Sustituir '<variable(s) generada(s)>' por las variables del dataset
* TODO: Añadir
subsample_pre interview_pre` si procede (sólo para Cohorte 2019, Ola 1)
keep ID_ECS q0007a_result proxy
<!--# TODO: Leer párrafos a continuación --> - Variable/s de identificación **La variable de identificación que debes incluir para la cohorte 2011 es ID_ECS**. Para conocer la equivalencia y las particularidades de las distintas variables de identificación, por favor, revisa la tabla 1 en el documento [LÉEME. Pautas para la creación de variables..docx](https://dauam-my.sharepoint.com/:w:/r/personal/marta_miret_uam_es/Documents/Edad%20con%20Salud/Documentacion%20Edad%20con%20Salud/Edad%20con%20salud%20-%20Ola%203/Outcomes/L%C3%89EME.%20Pautas%20para%20la%20creaci%C3%B3n%20de%20variables..docx?d=wb61214c5b3e542638e3af80472f0089c&csf=1&web=1&e=GFJJ2i) . - Variable(s) generada(s) Debes incluir la variable principal, así como las transformaciones pertinentes asociadas a esta variable. En el caso de que la/s variable/s generada/s que requiera/n la creación previa de otras variables, solo se incluirán aquellas que pueden resultar clave para entender o analizar la variable final. Por ejemplo, si creas una variable a partir de otra existente en la que eliminas casos con datos inválidos o modificas las etiquetas, no es necesario que incluyas esta información en este punto (tampoco en el documento de descripción). Los/as investigadores/as podrán verlo en el algoritmo. En caso que tengas dudas sobre qué variables incluir en este punto, por favor, pregunta a alguno de los/as compañeros responsables del proyecto. - Variables de apoyo Puesto que en ocasiones no todos los individuos contactados participan en el estudio (porque no quieren, porque no pueden, porque no los encontramos...) y dado que no todos los participantes responden a todos los ítems, se incluirán las siguientes variables como apoyo para la interpretación de los resultados: - **Variable estado de entrevista**: `q0007a_result`. El código 1 hace referencia a todas las personas que han participado en el estudio. - **Variable proxy**: proxy El código 1 hace referencia a los participantes que realizaron una entrevista proxy. Esto quiere decir que el individuo seleccionado no contestó las preguntas, sino que otra persona respondió en su lugar a una versión reducida del cuestionario. El código 2 hace referencia a los participantes que hicieron entrevista directa. Otras consideraciones: - Las bases de datos deben tener formato Stata 13 (.dta) - El nombre de estos archivos debe tener la siguiente estructura: "Outcome_[variablename]_[qualifier]". Se añadirá cualquier particularidad en caso que exista/n variable/s generadas en base a distintos criterios (e.g., diagnóstico, versión reducida). <!--# TODO: Borrar párrafos anteriores --> ```{stata save-data-test, eval=TEST} * TODO: Sustituir '<variable>' y '<qualifier>' por los valores correspondientes saveold "Outcome_<variable>_<qualifier>.dta", replace version(13)
``{stata save-data, eval=!TEST}
* TODO: Descomentar linea correspondiente a la cohorte y ola utilizada
* TODO: Comprobar que la ruta de destino coincide con la localización de
DOC`
* TODO: Sustituir '
saveold "~\UAM\Marta Miret Garcia - Documentacion Edad con Salud\Edad con salud - Ola 1 - Línea base\Outcomes\Outcome datasets\Outcome_
Cohorte 2011, ola 2:
saveold "~\UAM\Marta Miret Garcia - Documentacion Edad con Salud\Edad con salud - Ola 2\Outcomes\Outcome datasets\Outcome_
Cohorte 2011, ola 3:
saveold "~\UAM\Marta Miret Garcia - Documentacion Edad con Salud\Edad con salud - Ola 3\Outcomes\Cohorte 2011\Outcome datasets\Outcome_
Cohorte 2011, ola 4:
saveold "~\UAM\Marta Miret Garcia - Documentacion Edad con Salud\Edad con salud - Ola 4\Outcomes\Cohorte 2011\Outcome datasets\Outcome_
Cohorte 2019, ola 1:
saveold "~\UAM\Marta Miret Garcia - Documentacion Edad con Salud\Edad con salud - Ola 3\Outcomes\Cohorte 2019\Outcome datasets\Outcome_
Cohorte 2019, ola post-confinamiento:
<br> # Contact person: <!--# TODO: Leer párrafo a continuación --> Incluye tu nombre completo, correo electrónico, teléfono e institución a la que perteneces. Si el algoritmo que has generado ha estado basado en el trabajo que ya había hecho otro/a compañero/a, por favor, indícalo. <!--# TODO: Borrar párrafo anterior --> <!--# TODO: Completar '<Nombre y apellidos>', 'nombre.buzon@institucion.org>', y '<prefijo>' y '<teléfono>' --> - Name: <Nombre y apellidos> - e-mail: [\<nombre.buzon\@institucion.org\>](mailto:nombre.buzon@institucion.org){.email} - Phone number: (+<prefijo>) <teléfono> <br> <!--# TODO: Completar / eliminar "original version" según corresponda --> \< Original version: - Name: <Nombre y apellidos> - e-mail: [\<nombre.buzon\@institucion.org\>](mailto:nombre.buzon@institucion.org){.email} - Phone number: (+<prefijo>) <teléfono> \> # References <!--# TODO: Leer párrafo a continuación --> Indica las referencias utilizadas para explicar o generar la/s variable/s. Esta información será igualmente útil para citar apropiadamente en nuestros artículos científicos. <!--# TODO: Borrar párrafo anterior --> ::: {#refs} ::: \newpage <!--# TODO: Leer párrafos a continuación --> He terminado de generar la/s variable/s. ¡Maravilloso, enhorabuena! Cuando hayas terminado de generar la/s variable/s, por favor, actualiza el documento [C2011_W4_Planning_outcomes.xlsxl](https://dauam.sharepoint.com/:x:/r/sites/EdadconSalud-OutcomesC2011W4/Documentos compartidos/Outcomes C2011 W4/C2011_W4_Planning_outcomes.xlsx?d=w3e49821bd21047ab8f57ab5837db2393&csf=1&web=1&e=QQRWdn) \*Este documento hace referencia exclusiva a las variables de cohorte 2011, Ola 4. Así, el/la compañero/a al que le corresponda podrá examinar los distintos archivos y, sobre todo, el algoritmo. En caso de que se detecten inconsistencias, errores o surjan dudas, se te comunicará para proceder con su revisión. Finalmente, cuando todas las variables estén generadas y revisadas se creará una base de datos común con todas ellas y los datos sociodemográficos principales de los participantes. <!--# TODO: Borrar párrafos anteriores --> # Session info ```r devtools::session_info()
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.