textrecipes: Extra 'Recipes' for Text Processing

spacyr_tokenizer_words <- function(x) {
  tokens <- spacyr::spacy_parse(x, multithread = FALSE)
  doc_id <- factor(tokens$doc_id, paste0("text", seq_along(x)))
  token_list <- split(tokens$token, doc_id)
  names(token_list) <- NULL

  lemma_list <- split(tokens$lemma, doc_id)
  names(lemma_list) <- NULL

  pos_list <- split(tokens$pos, doc_id)
  names(pos_list) <- NULL

  tokenlist(token_list, lemma = lemma_list, pos = pos_list)
}

EmilHvitfeldt/textrecipes documentation built on April 7, 2024, 5:02 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

EmilHvitfeldt/textrecipes
Extra 'Recipes' for Text Processing

R/tokenizer-spacyr.R
In EmilHvitfeldt/textrecipes: Extra 'Recipes' for Text Processing

Defines functions spacyr_tokenizer_words

R Package Documentation

Browse R Packages

We want your feedback!

EmilHvitfeldt/textrecipes Extra 'Recipes' for Text Processing

R/tokenizer-spacyr.R In EmilHvitfeldt/textrecipes: Extra 'Recipes' for Text Processing

Defines functions spacyr_tokenizer_words

R Package Documentation

Browse R Packages

We want your feedback!

EmilHvitfeldt/textrecipes
Extra 'Recipes' for Text Processing

R/tokenizer-spacyr.R
In EmilHvitfeldt/textrecipes: Extra 'Recipes' for Text Processing