knitr::opts_chunk$set(echo = TRUE)
Ceci est un package de trucs pratiques que j'utilise au quotidien. C'est pourquoi il n'est pas très orienté communauté.
edouaRd
peut être installé depuis GitHub :
# install.packages("devtools") devtools::install_github("edouardschuppert/edouaRd")
povertext
permet d'appauvrir le texte, en supprimant tous les accents et trémas.
library(edouaRd, quietly = TRUE) povertext(c("Père Noël", "Où êtes-vous ?"))
wordfrequency
découpe les phrases en mots et les classe, permettant ainsi de savoir lesquels sont les plus utilisés. bigramfrequency
fait la même chose, mais avec des bigrams. hashtagfrequency
fait la même chose, mais avec les hashtags. La possibilité est offerte de ne garder qu'une partie de ces données.
suppressPackageStartupMessages(library(tidyverse)) edouaRd::rstats %>% wordfrequency(text) edouaRd::rstats %>% hashtagfrequency(text, slice = 30, original = TRUE) edouaRd::rstats %>% bigramfrequency(text, slice = 50)
datetimes_fr
transforme les dates et heures en un format français. dates_fr
fait la même chose mais uniquement avec les dates. Il faut noter que ceci n'est PAS un format utile pour travailler avec R. Cette fonction ne peut être utilisée que dans un but de rapport ou de présentation, afin d'obtenir un format très compréhensible.
Sys.time() datetimes_fr(Sys.time()) dates_fr(Sys.time())
distribution_time
permet de vérifier la distribution temporelle d'un jeu de données.
edouaRd::rstats %>% distribution_time(created_at, granularity = "hour")
Avec l'argument draw, cette distribution peut être exprimée de manière plus visuelle.
edouaRd::rstats %>% distribution_time(created_at, granularity = "hour", draw = TRUE)
rm_empty_cols
permet de supprimer les colonnes d'un tableau ne comprenant que des NA.
edouaRd::rstats rm_empty_cols(edouaRd::rstats)
Pour toute question ou suggestion, merci de consulter la section issues tracker.
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.