knitr::opts_chunk$set( collapse = TRUE, comment = "#>" )
library(didoscalim)
library(purrr) list_datasets() %>% dplyr::filter(grepl('évolution', .data$title)) %>% purrr::pwalk(~ delete_dataset(.))
add_or_update_*
Les fonctions add_or_update_*
recherche l'objet en comparant le paramètre
title
que vous passez avec les titres des objets.
Avant comparaison, le paramètre title
et les titres sont passés en minuscule
en conservant uniquement les caractères alphanumériques (y compris accentués).
La chaine "UN É & UN À." deviendra donc "unéunà".
dataset1 <- add_or_update_dataset( title = "données sur l'évolution des eaux de surface", description = "Un jeu de données de test", frequency = "unknown", topic = "Transports" ) dataset2 <- add_or_update_dataset( title = "Données sur l'évolution des eaux de surface.", description = "Un jeu de données de test", frequency = "unknown", topic = "Logement" ) dataset1$id == dataset2$id dataset1$title dataset1$topic dataset2$title dataset2$topic
La fonction de comparaison de base ne permet de modifier le titre d'un objet qu'à la marge (transformer une minuscule en majuscule, ajouter ou supprimer une ponctuation...).
Si, pour une raison quelconque, vous avez besoin de modifier ce titre de façon
plus importante (par exemple pour corriger un titre), vous pouvez remplacer
temporairement la méthode de base par votre propre méthode de comparaison en
fixant l'option didoscalim_title_comparison
.
La méthode s'applique sur la chaine "nettoyée" (passage en minuscule et conservation des caractères alphanumériques).
En exemple, la fonction suivante, qui s'appuie sur la librairie {stringdist}, permet de rechercher les titres qui ont une différence de 3 caractères maximum :
library(withr) library(stringdist) withr::local_options(list(didoscalim_title_comparison = function(column, string) { stringdist(column, string) <= 3 })) dataset1 <- add_or_update_dataset( title = "données sur l'évolution des espèce", description = "Un jeu de données de test", frequency = "unknown", topic = "Transports" ) dataset2 <- add_or_update_dataset( title = "Données sur l'évolution des espèces.", description = "Un jeu de données de test", frequency = "unknown", topic = "Transports" ) dataset1$id == dataset2$id dataset1$title dataset2$title
Dans ce cas, il est fortement conseillé d'utiliser l'option
didoscalim_update_only
afin d'éviter de créer des objets par erreur.
didoscalim_update_only(TRUE) dataset <- add_or_update_dataset( title = "Données sur l'évolution des écosystèmes.", description = "Un jeu de données de test", frequency = "unknown", topic = "Transports" )
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.