textclassificationexamples: Example Datasets and Functions for Text Classification MEAs

library(dplyr) # wrangling data
library(mosaic) # sampling dataframes
library(stringr) # str_remove nonASCII char encoding extras

headlines <- read.csv("data-raw/filtered_headlines.csv")
headlines$title <- iconv(headlines$title,
                             "latin1", "ASCII//TRANSLIT") %>%
  str_remove("\"")

set.seed(1999)

sample_headlines <- rbind(mosaic::sample(subset(
  headlines, clickbait == TRUE), 1000),
  mosaic::sample(subset(headlines,
                        clickbait == FALSE), 1000))%>%
  select(-orig.id)

headlines_train <- mosaic::sample(
  headlines,
  18360
) %>% # approximately 80% of headlines
  select(-orig.id)
headlines_test <- headlines %>%
  anti_join(
    headlines_train,
    "ids"
  )

usethis::use_data(headlines, overwrite = TRUE)
usethis::use_data(sample_headlines, overwrite = TRUE)
usethis::use_data(headlines_train, overwrite = TRUE)
usethis::use_data(headlines_test, overwrite = TRUE)

phebepalmer/textclassificationexamples documentation built on Aug. 22, 2020, 12:11 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

phebepalmer/textclassificationexamples
Example Datasets and Functions for Text Classification MEAs

data-raw/headlines.R
In phebepalmer/textclassificationexamples: Example Datasets and Functions for Text Classification MEAs

R Package Documentation

Browse R Packages

We want your feedback!

phebepalmer/textclassificationexamples Example Datasets and Functions for Text Classification MEAs

data-raw/headlines.R In phebepalmer/textclassificationexamples: Example Datasets and Functions for Text Classification MEAs

R Package Documentation

Browse R Packages

We want your feedback!

phebepalmer/textclassificationexamples
Example Datasets and Functions for Text Classification MEAs

data-raw/headlines.R
In phebepalmer/textclassificationexamples: Example Datasets and Functions for Text Classification MEAs