import_data: Connexion à la base de donnée

Description Usage Arguments Value Remplacement des valeurs manquantes par défaut

View source: R/data_load.R

Description

import_data permet de requêter des données mongoDB pour en faire un dataframe ou un Spark dataframe.
factor_query permet de fabriquer la requête d'aggrégation correspondante.

Usage

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
import_data(
  database,
  collection,
  mongodb_uri,
  batch,
  min_effectif,
  date_inf = NULL,
  date_sup = NULL,
  fields = NULL,
  sirets = NULL,
  code_ape = NULL,
  subsample = NULL,
  replace_missing = NULL,
  database_query_fun = query_mongodb
)

Arguments

database

character(1)
Nom de la base de données vers laquelle param exporter. Par défaut, celle stockée dans task.

collection

character(1)
Nom de la collection vers laquelle exporter. Par défaut, celle stockée dans task.

mongodb_uri

character(1)
url to the database in mongodb uri format.

batch

character(1)
Batch auquel doit être importées les données. Les modifications opérées par les batchs ultérieurs sont ignorées.

min_effectif

integer(1)
Limite basse du filtrage de l'effectif (la limite est incluse)

date_inf

Date(1)
Limite inférieure de la période de temps requêtée

date_sup

Date(1)
Limite supérieure de la période de temps requêtée

fields

character()
Noms des champs à requêter dans la base de données. Doit contenir "siret" et "periode". Si égal à NULL, alors charge tous les champs disponibles.

sirets

character()
Liste de sirens à exporter. Si égale à NULL, charge tous les sirens disponibles.

code_ape

character()
Liste de code NAF ou APE (niveau 2 à 5) à exporter. Si égale à NULL, charge tous les codes disponibles. Il est permis de mélanger des codes de différents niveaux.

subsample

integer(1)
Nombre d'objets (c'est-à-dire de couples siret x periode) à échantillonner.

replace_missing

list()
Liste nommée, dont les noms sont les noms de variables et les valeurs sont les valeurs de remplacement des NA. Si égal à NULL, alors des remplacements par défauts

database_query_fun

function Une fonction de requête à la base, qui permet notamment de simuler la requête dans le cadre des tests. Utiliser la fonction par défaut pour requêter la base mongodb en production.

Value

data.frame()

Remplacement des valeurs manquantes par défaut

replace_missing <- list( montant_part_patronale = 0, montant_part_ouvriere = 0, montant_echeancier = 0, ratio_dette = 0, ratio_dette_moy12m = 0, montant_part_patronale_past_1 = 0, montant_part_ouvriere_past_1 = 0, montant_part_patronale_past_2 = 0, montant_part_ouvriere_past_2 = 0, montant_part_patronale_past_3 = 0, montant_part_ouvriere_past_3 = 0, montant_part_patronale_past_6 = 0, montant_part_ouvriere_past_6 = 0, montant_part_patronale_past_12 = 0, montant_part_ouvriere_past_12 = 0, apart_heures_consommees = 0, apart_heures_autorisees = 0, apart_entreprise = 0, tag_default = FALSE, tag_failure = FALSE, tag_outcome = FALSE )


signaux-faibles/rsignauxfaibles documentation built on Dec. 2, 2020, 3:24 a.m.