CalCEN: CalCEN: Estimate Co-Expression Networks

library(tidyverse)
library(seqinr)
library(CalCEN)

parameters <- CalCEN::load_parameters()

# H99 transcripts
cmd <- paste0(
    "cd raw_data && ",
    "wget ", parameters$source_data$genome$transcript_fasta_url)
cat(cmd, "\n", sep = "")
system(cmd)

h99_transcripts <- seqinr::read.fasta(
    file = parameters$source_data$genome$transcript_fasta_url,
    seqtype = "AA")
    
h99_transcript_annotations <- h99_transcripts %>%
    purrr::map_chr(~seqinr::getAnnot(.)) %>%
    data.frame(annotation = .) %>%
    tidyr::separate(
        col = annotation,
        into = c("cnag_id", "gene", "organism", "gene_product", "transcript_product", "location", "length", "sequence_SO", "SO", "is_pseudo"),
        sep = " [|] ") %>%
    dplyr::mutate(
        dplyr::across(
            .cols = everything(),
            ~stringr::str_replace(., "^[a-zA-Z_]+=", ""))) %>%
    dplyr::mutate(
        variant = cnag_id %>% stringr::str_extract("t[0-9]+_[0-9]+$"),
        is_pseudo = ifelse(is_pseudo == "true", TRUE, FALSE)) %>%
    dplyr::select(-gene)

save(
    h99_transcript_annotations,
    file = "intermediate_data/h99_transcript_annotations.Rdata")

h99_transcript_annotations %>%
    readr::write_tsv(file = "product/h99_transcript_annotations_20210724.tsv")

momeara/CalCEN documentation built on Jan. 3, 2023, 7:22 p.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

momeara/CalCEN
CalCEN: Estimate Co-Expression Networks

vignettes/CryptoCEN/scripts/1_gather_fungidb_data.R
In momeara/CalCEN: CalCEN: Estimate Co-Expression Networks

R Package Documentation

Browse R Packages

We want your feedback!

momeara/CalCEN CalCEN: Estimate Co-Expression Networks

vignettes/CryptoCEN/scripts/1_gather_fungidb_data.R In momeara/CalCEN: CalCEN: Estimate Co-Expression Networks

R Package Documentation

Browse R Packages

We want your feedback!

momeara/CalCEN
CalCEN: Estimate Co-Expression Networks

vignettes/CryptoCEN/scripts/1_gather_fungidb_data.R
In momeara/CalCEN: CalCEN: Estimate Co-Expression Networks