In jrufv/TFMjrufv: Framework para el análisis de datos ómicos

knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>",
  fig.path = "man/figures/README-",
  out.width = "100%"
)

TFMjrufv

Este paquete pretende crear un pipeline que permita realizar un análisis estadístico completo de diferentes tipos de datos ómicos.

Instalación

Puede instalar la versión en desarrollo desde GitHub con:

install.packages("devtools")
library(devtools)
devtools::install_github("jrufv/TFMjrufv", upgrade = "always")
library(TFMjrufv)

Ejemplo 1. Datos de microarray

1.1 Carga de paquetes de Bioconductor

En primer lugar usamos la función ins_pack() para instalar (en caso necesario) y cargar los paquetes de Bioconductor necesarios. Además podemos añadir el paquete de anotaciones que usaremos durante el análisis.

library(TFMjrufv)
ins_pack(annot_pack = "hgu133a.db")

1.2 Lectura de datos

Los datos los tenemos almacenados en archivos .CEL (uno por muestra). Además debemos crear un archivo de texto en el que indicaremos las características de cada muestra para poder realizar el análisis.

Nota: Se recomienda cambiar el directorio de trabajo a la carpeta del paquete. De lo contrario deberá modificar los parámetros path y targets para especificar la ruta de archivo específica.

data_microarray <- read_data(data_type = "microarray",
                             path = "./inst/extdata/microarray",
                             targets = "./inst/extdata/microarray/targets.csv",
                             sep_targ = ";",
                             gz_file = FALSE)
head(exprs(data_microarray))
pData(data_microarray)

1.3 Visualización de los dato brutos

La función plotTFM() permite visualizar diferentes gráficos.

plotTFM(data_microarray, plot = "boxplot")
plotTFM(data_microarray, plot = "density")
plotTFM(data_microarray, plot = "PCA")
plotTFM(data_microarray, plot = "heatmap")
plotTFM(data_microarray, plot = "heatmapS")

1.4 Preprocesamiento y normalizacion

La función prep_norm_microarray() permite realizar el filtraje no específico de los datos mediante los argumentos varFilter y featureFilter, y posteriormente realiza la normalización de los datos.

norm_data_microarray <- prep_norm_microarray(data_microarray,
                                             varFilter = TRUE,
                                             featureFilter = TRUE,
                                             annot_pack = "hgu133a.db")
head(exprs(norm_data_microarray))

1.5 Visualización de los datos normalizados

Una vez se han normalizado los datos se pueden comparar los gráficos antes y después de la normalización.

plotTFM(norm_data_microarray, plot = "boxplot")
plotTFM(norm_data_microarray, plot = "density")
plotTFM(norm_data_microarray, plot = "PCA")
plotTFM(norm_data_microarray, plot = "heatmap")
plotTFM(norm_data_microarray, plot = "heatmapS")

1.6 Análisis de expresión diferencial

La función dea() realiza un análisis de expresión diferencial basado en modelos lineales del paquete limma. El retorno de la funcion consta de una lista con un marco de datos para cada contraste realizado, una tabla que muestra la cantidad de analitos sobreexpresados e infraexpresados por contraste y un objeto TestResults que mantiene los analitos que han mostrado expresión diferencial en algún contraste.

dea_microarray <- dea(norm_data_microarray, cont = "Treated-Untreated",
                      name = "TRvsUN", maxanal = 1000, adjmethod = "fdr",
                      pvalcoff = 0.1, dtmethod = "separate")
head(dea_microarray[[1]])
dea_microarray[[2]]
dea_microarray[[3]]

1.7 Anotación de resultados

A continuacion se añaden las anotaciones de los genes seleccionados en cada contraste (en nuestro caso un unico contraste).

anot_dea_microarray <- annotated(dea_microarray, maPackage = "hgu133a.db",
                                 ID = "PROBEID")
head(anot_dea_microarray[[1]])

1.8 Análisis de significación biológica

Finalmente podemos realizar el análisis de enriquecimiento para encontrar las vías que se expresan diferencialmente en cada contraste.

enRes_microarray <- bsa(anot_dea_microarray, GOPackage = org.Hs.egGO,
                        PATHPackage = org.Hs.egPATH, organism = "human",
                        pvcoff = 0.05, padmethod = "BH")
enRes_microarray