knitr::opts_chunk$set( collapse = TRUE, comment = "#>", fig.path = "man/figures/README-", out.width = "100%" )
Este paquete pretende crear un pipeline que permita realizar un análisis estadístico completo de diferentes tipos de datos ómicos.
Puede instalar la versión en desarrollo desde GitHub con:
install.packages("devtools") library(devtools) devtools::install_github("jrufv/TFMjrufv", upgrade = "always") library(TFMjrufv)
En primer lugar usamos la función ins_pack()
para instalar (en caso necesario) y cargar los paquetes de Bioconductor necesarios. Además podemos añadir el paquete de anotaciones que usaremos durante el análisis.
library(TFMjrufv) ins_pack(annot_pack = "hgu133a.db")
Los datos los tenemos almacenados en archivos .CEL (uno por muestra). Además debemos crear un archivo de texto en el que indicaremos las características de cada muestra para poder realizar el análisis.
Nota: Se recomienda cambiar el directorio de trabajo a la carpeta del paquete. De lo contrario deberá modificar los parámetros path
y targets
para especificar la ruta de archivo específica.
data_microarray <- read_data(data_type = "microarray", path = "./inst/extdata/microarray", targets = "./inst/extdata/microarray/targets.csv", sep_targ = ";", gz_file = FALSE) head(exprs(data_microarray)) pData(data_microarray)
La función plotTFM()
permite visualizar diferentes gráficos.
plotTFM(data_microarray, plot = "boxplot") plotTFM(data_microarray, plot = "density") plotTFM(data_microarray, plot = "PCA") plotTFM(data_microarray, plot = "heatmap") plotTFM(data_microarray, plot = "heatmapS")
La función prep_norm_microarray()
permite realizar el filtraje no específico de los datos mediante los argumentos varFilter
y featureFilter
, y posteriormente realiza la normalización de los datos.
norm_data_microarray <- prep_norm_microarray(data_microarray, varFilter = TRUE, featureFilter = TRUE, annot_pack = "hgu133a.db") head(exprs(norm_data_microarray))
Una vez se han normalizado los datos se pueden comparar los gráficos antes y después de la normalización.
plotTFM(norm_data_microarray, plot = "boxplot") plotTFM(norm_data_microarray, plot = "density") plotTFM(norm_data_microarray, plot = "PCA") plotTFM(norm_data_microarray, plot = "heatmap") plotTFM(norm_data_microarray, plot = "heatmapS")
La función dea()
realiza un análisis de expresión diferencial basado en modelos lineales del paquete limma. El retorno de la funcion consta de una lista con un marco de datos para cada contraste realizado, una tabla que muestra la cantidad de analitos sobreexpresados e infraexpresados por contraste y un objeto TestResults que mantiene los analitos que han mostrado expresión diferencial en algún contraste.
dea_microarray <- dea(norm_data_microarray, cont = "Treated-Untreated", name = "TRvsUN", maxanal = 1000, adjmethod = "fdr", pvalcoff = 0.1, dtmethod = "separate") head(dea_microarray[[1]]) dea_microarray[[2]] dea_microarray[[3]]
A continuacion se añaden las anotaciones de los genes seleccionados en cada contraste (en nuestro caso un unico contraste).
anot_dea_microarray <- annotated(dea_microarray, maPackage = "hgu133a.db", ID = "PROBEID") head(anot_dea_microarray[[1]])
Finalmente podemos realizar el análisis de enriquecimiento para encontrar las vías que se expresan diferencialmente en cada contraste.
enRes_microarray <- bsa(anot_dea_microarray, GOPackage = org.Hs.egGO, PATHPackage = org.Hs.egPATH, organism = "human", pvcoff = 0.05, padmethod = "BH") enRes_microarray
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.