book_sections: Gutenberg Project books dataset
In mangoTraining: Mango Solutions Training Datasets

A mixed up collection of words from different book sections of two books.

1	book_sections

A tibble with 108,657 observations, each a word on a document. This data set is designed to show how LDA can be used to separate a set of mixed documents into two distinct "topics" (or books).

word: Words from a given section within a book.
document: The book section ID that the word came from.

Data taken from two books of the Gutenberg Project

https://www.gutenberg.org/

mangoTraining documentation built on April 28, 2021, 9:07 a.m.

mangoTraining index

Package overview

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

mangoTraining
Mango Solutions Training Datasets

book_sections: Gutenberg Project books dataset
In mangoTraining: Mango Solutions Training Datasets

Description

Usage

Format

Source

Related to book_sections in mangoTraining...

R Package Documentation

Browse R Packages

We want your feedback!

mangoTraining Mango Solutions Training Datasets

book_sections: Gutenberg Project books dataset In mangoTraining: Mango Solutions Training Datasets

Description

Usage

Format

Source

Related to book_sections in mangoTraining...

R Package Documentation

Browse R Packages

We want your feedback!

mangoTraining
Mango Solutions Training Datasets

book_sections: Gutenberg Project books dataset
In mangoTraining: Mango Solutions Training Datasets