title: "literaturaBR" output: github_document
NOTE: This package is strictly intented for Portuguese speakers or people fluent in Portuguese. As it does not make any reasonable sense to do Text Mining tasks in a language you are not comfortable with, the documentation and the vignettes of literaturaBR
shall be provided only in Portuguese.
literaturaBR
possibilita que usuários R importem da maneira mais fácil possível textos clássicos com o objetivo de realizar tarefas de Text Mining, como Análise de Sentimento e técnicas quantitativas aplicadas a datasets textuais. Um exemplo de utilização do pacote está em meu site.
Até o momento, estes livros estão disponíveis no pacote:
Os livros providenciados pelo literaturaBR
estão em domínio público e são extraídos do site Wikisource por meio de web scraping. O código escrito para extrair os livros e os converter em dataframe estão presentes na pasta data-raw/
.
Você pode solicitar um novo livro para o pacote abrindo uma issue neste repositório. Em até duas semanas eu disponibilizo o livro que pedirem.
Este pacote, juntamente com meu outro pacote lexiconPT
, tem o potencial de atrair para o mundo R pessoas de especialidades que não costumam programar, como Letras e História. Se você é estudante desses cursos, tem interesse em usar o pacote literaturaBR
mas tem pouca experiência em programar com R, entre em contato comigo.
Um exemplo de utilização do pacote pode ser encontrado [neste post] no meu site.
Para instalar o pacote, que por enquanto está disponível apenas no Github, rode o comando abaixo:
devtools::install_github("sillasgonzaga/literaturaBR")
Para importar o dataset de um livro, basta usar a função data()
. Você pode conferir os datasets disponíveis no literaturaBR
com o comando data(package = 'literaturaBR')
.
Agradeço ao professor Ariel Levy da UFF por me encorajar a fazer o pacote falando sobre como ele poderia ser útil para disseminar o R em outros departamentos além das exatas e biológicas.
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.