data-raw/DATASET.R

## code to prepare `suivi` dataset

library(tidyverse)

suivi.sale <- read_csv2(
  "data-raw/2020-11-24_butinages.csv",
  locale = locale(encoding = "ISO-8859-1")
)


# FAIT A LA MAIN : remplir les noms latins des espèces dans le .csv pour faciliter la sélection
# FAIT A LA MAIN : compléter le tableau suivi (coordonnées géographiques)
# FAIT A LA MAIN : compléter le tableau especes (statut et lien photo)
# (statuts et nom vernaculaire checkés avec CBNM + wikipedia)


suivi <- suivi.sale %>%
  filter(
    str_detect(g_latin, "(Hypericum)|(Callistemon)|(Schinus)|(Dictyosperma)|(Litchi)|(Pandanus)|(Aphloia)|(Persea)|(Tetradenia)|(Scaevola)|(Citrus)"), # genres à conserver
    !str_detect(e_latin, "sylvestris"), # sans le pandanus sylvestris
    !str_detect(vernaculaire, "fruit") | is.na(vernaculaire) # sans les fruits
    )

table(suivi$g_latin)




especes <- suivi %>%
  distinct(g_latin, e_latin) %>%
  arrange(g_latin) %>%
  mutate(espece = str_c(str_sub(g_latin, end = 3), str_sub(e_latin, end = 3)) %>% str_to_upper()) %>%  # code en 6 lettres
  left_join(
    tribble(
      ~espece,  ~vernaculaire,       ~statut,    ~img_src,
      "APHTHE", "Change-écorce",     "Indigène", "https://upload.wikimedia.org/wikipedia/commons/0/0d/Aphloia-theiformis0073.JPG",
      "CALVIM", "Rince-bouteille",   "Exotique", "https://upload.wikimedia.org/wikipedia/commons/e/ed/Callistemon_-_%C3%A9pis_en_goupillon_-_arbuste_%22rince-bouteilles%22_%C3%A0_Roquebrune-Cap_Martin_-_piscine_de_Carnoles_-_d%C3%A9tails.JPG",
      "CITSP.", "Agrumes",           "Exotique", "https://upload.wikimedia.org/wikipedia/commons/thumb/6/65/Agrumes_Cl_J_Weber_07_%2823307448639%29.jpg/80px-Agrumes_Cl_J_Weber_07_%2823307448639%29.jpg",
      "DICALB", "Palmiste blanc",    "Indigène", "https://upload.wikimedia.org/wikipedia/commons/f/f9/Dictyosperma_album1.JPG",
      "HYPLAN", "Fleur jaunes",      "Indigène", "https://upload.wikimedia.org/wikipedia/commons/c/c8/Hypericum_lanceolatum.JPG",
      "LITCHI", "Letchi",            "Exotique", "https://upload.wikimedia.org/wikipedia/commons/thumb/d/df/Fleurs_de_letchis.jpg/120px-Fleurs_de_letchis.jpg",
      "PANUTI", "Vacoa",             "Indigène", "https://upload.wikimedia.org/wikipedia/commons/thumb/f/f3/Vacoas_ansedescascades.jpg/90px-Vacoas_ansedescascades.jpg",
      "PERAME", "Avocat",            "Exotique", "https://upload.wikimedia.org/wikipedia/commons/thumb/2/26/Honeybee_%28Apis_mellifera%29_pollinating_Avocado_cv.jpg/120px-Honeybee_%28Apis_mellifera%29_pollinating_Avocado_cv.jpg",
      "SCATAC", "Manioc bord'mer",   "Indigène", "https://upload.wikimedia.org/wikipedia/commons/thumb/f/f9/Scaevola_taccada_flower.jpg/120px-Scaevola_taccada_flower.jpg",
      "SCHTER", "Baie rose",         "Exotique", "https://upload.wikimedia.org/wikipedia/commons/d/d9/Pink_Peppercorns_%28Schinus_terebinthifolius%29.JPG",
      "TETRIP", "Faux patchouli",    "Exotique", "https://upload.wikimedia.org/wikipedia/commons/8/86/Tetradenia_riparia_03.jpg"
    )
  )




# write.csv2(suivi, "data-raw/suivi.csv", row.names = FALSE, fileEncoding = "ISO-8859-1")
# ATTENTION suivi a été modifié manuellement !

write.csv2(especes, "data-raw/especes.csv", row.names = FALSE, fileEncoding = "ISO-8859-1")



# Exporter les tables sous un meilleur format : ce seront celles-là qu'il faut remplir par la suite !!!!!!!

suivi <- read_csv2("data-raw/suivi.csv")

especes <- read_csv2(
  "data-raw/especes.csv",
  locale = locale(encoding = "ISO-8859-1"))

suivi <- especes %>%
  select(g_latin, e_latin, espece) %>%
  right_join(suivi) %>%
  select(-g_latin, -e_latin, -vernaculaire) %>%
  relocate(espece, .after = commune)

write.csv2(suivi, "data-raw/suivi.csv", row.names = FALSE, fileEncoding = "ISO-8859-1")


# Code final ####

library(tidyverse)


suivi <- read_csv2(
    "data-raw/suivi.csv",
    locale = locale(encoding = "ISO-8859-1")) %>%
  mutate(date = lubridate::dmy(date)) %>% # la date en date
  select(-lieu, -commune) %>% # virer les colonnes inutiles
  filter(
    !is.na(latitude), # enlever les valeurs manquantes
    date > lubridate::ymd(20120101) # enlever les valeurs trop anciennes (?)
    ) %>%
  left_join(read_csv2(
    "data-raw/especes.csv",
    locale = locale(encoding = "ISO-8859-1"))) %>%  # ajouter infos liées aux espèces
  distinct() # enlever les lignes en double

ftable(statut ~ vernaculaire, data = suivi)

# add spatial noise
# allzips$latitude <- jitter(allzips$latitude)
# allzips$longitude <- jitter(allzips$longitude)



usethis::use_data(suivi, overwrite = TRUE)
anna-doizy/butinagepei documentation built on Feb. 19, 2021, 4:59 p.m.