read_data: Lectura de archivos de datos ómicos

Description Usage Arguments Value Examples

View source: R/1_lectura_de_datos.R

Description

Lectura de diferentes tipos de archivos de datos ómicos y construcción de un objeto en el que almacenar los datos de los ensayos y las muestras.

Usage

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
read_data(
  data_type,
  path,
  gz_file,
  file_type,
  raw_data,
  sep_rd = "",
  targets,
  sep_targ = "",
  mode = "onDisk"
)

Arguments

data_type

Tipo de datos a introducir, puede ser "microarray", "RNA-Seq", "MetabRS", "MetabSB" o "MetabMC".

path

Ruta de ubicación de los archivos para data_type = "microarray" o "MetabRS".

gz_file

Lógico, si es TRUE se leerán archivos con extensión ".CEL.gz")

file_type

Tipo de archivos, para data_type = "MetabRS". Puede ser ".NetCDF", ".mzML", ".mzXML" o ".mzData".

raw_data

Ruta y nombre del archivo con los datos brutos del experimento, para data_type = "RNA-Seq", "MetabSB" o "MetabMC". Debe ser un archivo .csv o .txt con cabecera. La primera columna debe corresponder a los genes ("RNA-Seq"), los bins ("MetabSB") o los metabolitos ("MetabMC") y las siguientes a las muestras.

sep_rd

Carácter separador de campo para el archivo raw_data. Los valores de cada línea del archivo están separados por este carácter. De forma predeterminada sep_rd = "".

targets

Ruta y nombre del archivo con la información sobre las muestras del experimento. Debe ser un archivo .csv o .txt con cabecera. Para data_type = "microarray" o "MetabRS" debe tener tres columnas como mínimo, la primera con el nombre de los archivos que contienen los datos de cada muestra, la segunda con un identificador único de las muestras y la tercera con el grupo experimental de las muestras. Para el resto debe tener dos columnas como mínimo, la primera con el identificador de las muestras y la segunda con el grupo experimental de las muestras. En ambos casos se aceptan más columnas como covariables.

sep_targ

Carácter separador de campo para el archivo targets. Los valores de cada línea del archivo están separados por este carácter. De forma predeterminada sep_targ = "".

mode

Puede ser "inMemory" (predeterminado) o "onDisk". El primero carga los datos sin procesar en la memoria, mientras que el segundo solo genera el objeto y se accede a los datos sin procesar en el disco cuando es necesario (sólo válido para data_type = "MetabRS").

Value

Un objeto de la clase ExpressionFeatureSet (para microarrays), DGEList (para RNA-Seq), OnDiskMSnExp o MSnExp (para espectros brutos de GC/LC-MS), SummarizedExperiment (para contenedores de espectros de MS/NMR), o MSnSet (para concentraciones de metabolitos) que contiene los datos de los ensayos y datos sobre las muestras.

Examples

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
# Para microarrays
data_microarray <- read_data(data_type = "microarray",
                             path = "./inst/extdata/microarray",
                             targets = "./inst/extdata/microarray/targets.csv",
                             sep_targ = ";",
                             gz_file = FALSE)
data_microarray

# Para RNA-Seq
data_RNASeq <- read_data(data_type = "RNA-Seq",
                         raw_data = "./inst/extdata/RNA-Seq/counts.csv",
                         sep_rd = "\t",
                         targets = "./inst/extdata/RNA-Seq/targets.csv",
                         sep_targ = ",")
data_RNASeq

# Para Espectros Brutos de GC/LC-MS
data_MetabRS <- read_data(data_type = "MetabRS",
                          path = "./inst/extdata/Met_mzML",
                          file_type = ".mzML",
                          targets = "./inst/extdata/Met_mzML/targets.csv",
                          sep_targ = ";",
                          mode = "onDisk")
data_MetabRS

# Para Contenedores de Espectros de MS/NMR
data_MetabSB <- read_data(data_type = "MetabSB",
                          raw_data = "./inst/extdata/Met_spectra_bins/spectra.csv",
                          sep_rd = ",",
                          targets = "./inst/extdata/Met_spectra_bins/targets.csv",
                          sep_targ = ",")
data_MetabSB

# Para Concentraciones de Metabolitos
data_MetabMC <- read_data(data_type = "MetabMC",
                         raw_data = "./inst/extdata/Met_conc/concent.csv",
                         sep_rd = ",",
                         targets = "./inst/extdata/Met_conc/targets.csv",
                         sep_targ = ",")
data_MetabMC

jrufv/TFMjrufv documentation built on Dec. 21, 2021, 3:15 a.m.