tidygramr: Clean Text and Create Tidy n-grams Using Tools such as 'tidytext'

# library(testthat)
# context("Count n-gram frequencies")
#
test_that("count unigram frequencies for the corpus", {
  if (require("janeaustenr", quietly = TRUE)) {
    if(require("tidytext", quietly = TRUE)) {
      unigrams <- create_ngrams(austen_books(), "unigram", stopwords=stop_words)
      unigram_freqs <- count_ngrams(unigrams,doc_title="book")

      # Expect colunm names: ngram, n
      expect_equal(length(unigram_freqs),2)
    }
  }
})

test_that("count unigram frequencies for the corpus, by book", {
  if (require("janeaustenr", quietly = TRUE)) {
    if(require("tidytext", quietly = TRUE)) {
      unigrams <- create_ngrams(austen_books(), "unigram", stopwords=stop_words)
      unigram_freqs <- count_ngrams(unigrams,by_book=TRUE,doc_title="book")

      # Expect colunm names: book, ngram, n
      expect_equal(length(unigram_freqs),3)
    }
  }
})

test_that("count bigram frequencies for the corpus", {
  if (require("janeaustenr", quietly = TRUE)) {
    if(require("tidytext", quietly = TRUE)) {
      bigrams <- create_ngrams(austen_books(), "bigram", stopwords=stop_words)
      bigram_freqs <- count_ngrams(bigrams,doc_title="book")

      # Expect colunm names: ngram, n
      expect_equal(length(bigram_freqs),2)
    }
  }
})

test_that("count bigram frequencies for the corpus, by book", {
  if (require("janeaustenr", quietly = TRUE)) {
    if(require("tidytext", quietly = TRUE)) {
      bigrams <- create_ngrams(austen_books(), "bigram", stopwords=stop_words)
      bigram_freqs <- count_ngrams(bigrams,by_book=TRUE,doc_title="book")

      # Expect colunm names: book, ngram, n
      expect_equal(length(bigram_freqs),3)
    }
  }
})

test_that("count trigram frequencies for the corpus", {
  if (require("janeaustenr", quietly = TRUE)) {
    if(require("tidytext", quietly = TRUE)) {
      trigrams <- create_ngrams(austen_books(), "trigram", stopwords=stop_words)
      trigram_freqs <- count_ngrams(trigrams,doc_title="book")

      # Expect colunm names: ngram, n
      expect_equal(length(trigram_freqs),2)

      # Most common trigram correctly obtained
      expect_match(trigram_freqs$ngram[1],"dear miss woodhouse")
      expect_equal(trigram_freqs$n[1],23)
    }
  }
})

test_that("count trigram frequencies for the corpus, by book", {
  if (require("janeaustenr", quietly = TRUE)) {
    if(require("tidytext", quietly = TRUE)) {
      trigrams <- create_ngrams(austen_books(), "trigram", stopwords=stop_words)
      trigram_freqs <- count_ngrams(trigrams,by_book=TRUE,doc_title="book")

      # Expect colunm names: book, ngram, n
      expect_equal(length(trigram_freqs),3)
    }
  }
})

cldatascience/tidygramr documentation built on May 10, 2019, 1:09 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

cldatascience/tidygramr
Clean Text and Create Tidy n-grams Using Tools such as 'tidytext'

tests/testthat/test_count_ngrams.R
In cldatascience/tidygramr: Clean Text and Create Tidy n-grams Using Tools such as 'tidytext'

R Package Documentation

Browse R Packages

We want your feedback!

cldatascience/tidygramr Clean Text and Create Tidy n-grams Using Tools such as 'tidytext'

tests/testthat/test_count_ngrams.R In cldatascience/tidygramr: Clean Text and Create Tidy n-grams Using Tools such as 'tidytext'

R Package Documentation

Browse R Packages

We want your feedback!

cldatascience/tidygramr
Clean Text and Create Tidy n-grams Using Tools such as 'tidytext'

tests/testthat/test_count_ngrams.R
In cldatascience/tidygramr: Clean Text and Create Tidy n-grams Using Tools such as 'tidytext'