compMS2Miner: an automatable metabolite identification, visualization and data-sharing R package for high-resolution LC-MS datasets

#' Adapted from PubMedWordCloud (cleanAbstracts) to work with compMS2Miner
#' @param Abs	output of getAbs, or just a paragraph of text
#' @export
cleanAbs <- function(Abs, rmNum = TRUE, tolw = TRUE, toup = FALSE, 
          rmWords = TRUE, yrWords = NULL, stemDoc = FALSE){
  abstTxt <- tm::Corpus(tm::VectorSource(Abs))
  text2.corpus = tm::tm_map(abstTxt, tm::removePunctuation)
  if (rmNum == TRUE) {
    text2.corpus = tm::tm_map(text2.corpus, function(x) tm::removeNumbers(x))
  }
  if (tolw == TRUE) {
    text2.corpus = tm::tm_map(text2.corpus, tolower)
  }
  if (toup == TRUE) {
    text2.corpus = tm::tm_map(text2.corpus, toupper)
  }
  if (rmWords == TRUE) {
    text2.corpus = tm::tm_map(text2.corpus, tm::removeWords, tm::stopwords("english"))
    if (!is.null(yrWords)) {
      text2.corpus = tm::tm_map(text2.corpus, tm::removeWords, 
                            yrWords)
    }
  }
  if (stemDoc == TRUE) {
    text2.corpus = tm::tm_map(text2.corpus, tm::stemDocument)
  }
  text2.corpus <- tm::tm_map(text2.corpus, tm::PlainTextDocument)
  
  # tdm <- TermDocumentMatrix(text2.corpus)
  indWords <- gsub(' ', '', unlist(strsplit(text2.corpus$content$content, ' ')))
  indWords <- indWords[indWords != '']
  tdm <- table(indWords)
  m <- as.matrix(tdm)
  v <- sort(rowSums(m), decreasing = TRUE)
  d <- data.frame(word = names(v), freq = v)
  return(d)
} # end function

WMBEdmands/compMS2Miner documentation built on May 9, 2019, 10:04 p.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

WMBEdmands/compMS2Miner
an automatable metabolite identification, visualization and data-sharing R package for high-resolution LC-MS datasets

R/cleanAbs.R
In WMBEdmands/compMS2Miner: an automatable metabolite identification, visualization and data-sharing R package for high-resolution LC-MS datasets

R Package Documentation

Browse R Packages

We want your feedback!

WMBEdmands/compMS2Miner an automatable metabolite identification, visualization and data-sharing R package for high-resolution LC-MS datasets

R/cleanAbs.R In WMBEdmands/compMS2Miner: an automatable metabolite identification, visualization and data-sharing R package for high-resolution LC-MS datasets

R Package Documentation

Browse R Packages

We want your feedback!

WMBEdmands/compMS2Miner
an automatable metabolite identification, visualization and data-sharing R package for high-resolution LC-MS datasets

R/cleanAbs.R
In WMBEdmands/compMS2Miner: an automatable metabolite identification, visualization and data-sharing R package for high-resolution LC-MS datasets