split_data: Scission des données en échantillon d'entraînement et de...

Description Usage Arguments Value Methods (by class)

View source: R/interface_generics.R

Description

Scinde les données historiques en échantillon d'entraînement et de test, selon le ratio souhaité. S'assure que deux établissements de la même entreprise ne soient pas à la fois dans deux échantillons différents pour éviter la fuite d'information d'un échantillon vers l'autre.

Usage

1
2
3
4
## S3 method for class 'sf_task'
split_data(task, ratio = 2/3, nfolds = 5, resampling_strategy = "holdout", ...)

split_data(task, ...)

Arguments

task

[sf_task]
Objet s3 de type sf_task

ratio

numeric(1)
Ratio des données utilisées pour l'entraînement. Ignoré si 'resampling_strategy != "holdout"'

nfolds

numeric(1)
Nombre d'échantillons de validation croisé. Ignoré si 'resampling_strategy != "cv"'.

resampling_strategy

character(1)
Ou bien "holdout" ou "cv". Toute autre valeur n'occasionne aucun échantillonnage.

...

Not used

Value

[sf_task]
L'objet task donné en entrée auquel les champs "train_data", et "test_data" ont été ajoutés (ou écrasés), chacun contenant un data.frame() avec les colonnes de task[["hist_data"]] et un sous-ensemble (possiblement vide) de ses lignes.

Methods (by class)


signaux-faibles/rsignauxfaibles documentation built on Dec. 2, 2020, 3:24 a.m.