SOCRATex: Staged Optimization of Curation, Regularization, and Annotation of clinical Text

Documented in unigramTokenizer

#' unigranTokenizer function
#'
#' This is a uni-gram tokenizer for creating Document-Term Matrix
#'
#' @param x   text data which can be tokenized
#' @import tm
#' @importFrom NLP ngrams
#' @importFrom NLP words
#'
#' @export

unigramTokenizer <- function(x){unlist(lapply(NLP::ngrams(NLP::words(x), 1), paste, collapse = " "), use.names = FALSE)}

ABMI/SOCRATex documentation built on March 20, 2021, 11:01 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

ABMI/SOCRATex
Staged Optimization of Curation, Regularization, and Annotation of clinical Text

R/UnigramTokenizer.R
In ABMI/SOCRATex: Staged Optimization of Curation, Regularization, and Annotation of clinical Text

Defines functions unigramTokenizer

Documented in unigramTokenizer

R Package Documentation

Browse R Packages

We want your feedback!

ABMI/SOCRATex Staged Optimization of Curation, Regularization, and Annotation of clinical Text

R/UnigramTokenizer.R In ABMI/SOCRATex: Staged Optimization of Curation, Regularization, and Annotation of clinical Text

Defines functions unigramTokenizer

Documented in unigramTokenizer

R Package Documentation

Browse R Packages

We want your feedback!

ABMI/SOCRATex
Staged Optimization of Curation, Regularization, and Annotation of clinical Text

R/UnigramTokenizer.R
In ABMI/SOCRATex: Staged Optimization of Curation, Regularization, and Annotation of clinical Text