View source: R/acep_pipeline.R
| pipe_clean | R Documentation |
Aplica limpieza y normalización de texto dentro de un flujo pipeline. Esta función actúa como adaptador de 'acep_clean()' para trabajar con objetos 'acep_corpus', registrando las transformaciones aplicadas.
pipe_clean(corpus, ...)
corpus |
Objeto 'acep_corpus' o vector de caracteres. Si se pasa un vector, se crea automáticamente un objeto 'acep_corpus'. |
... |
Argumentos para 'acep_clean()'. Ejemplos: 'rm_stopwords = TRUE', 'rm_num = TRUE', 'tolower = TRUE', 'rm_punt = TRUE'. |
Objeto 'acep_corpus' con el campo 'texto_procesado' actualizado y registro de la transformación en 'procesamiento$limpieza'.
# Crear corpus y limpiar
textos <- c("El SUTEBA va al paro!!!", "SOIP protesta 123")
corpus <- acep_corpus(textos)
corpus_limpio <- pipe_clean(corpus, rm_punt = TRUE, rm_num = TRUE)
print(corpus_limpio)
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.