sample_balanced: Zufaellige (klassenbalancierte) Ereignisse

Description Usage Arguments Details Value See Also

View source: R/sample.R

Description

Bestimmt in einem Zeitraum zufaellig eine feste Anzahl an Ereignissen (Sampling). Diese Ereignisse beziehen sich auf eine Menge an Zielereignissen (z.B. Stoerungen) und werden dabei in positive und negative Ereignisse unterschieden. Zur Platzierung der Ereignisse wird auf die Funktion sample_random zurueckgegriffen (sample_balanced) bzw. wird sequentiell die Menge aller im Zeitraum moeglichen Ereignisse gebildet und anschliessend daraus eine zufaellige Stichprobe gezogen (sample_balanced_seq).

Usage

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
sample_balanced(
  n,
  int_start,
  int_end,
  offtime = NULL,
  target_event,
  target_cut_in_sec,
  event_length_in_sec,
  event_overlap_in_sec = 0,
  include_tail = FALSE,
  .seed = NULL,
  .max_run = 1000
)

sample_balanced_seq(
  n,
  int_start,
  int_end,
  offtime = NULL,
  target_event,
  target_cut_in_sec,
  event_length_in_sec,
  event_overlap_in_sec = 0,
  from_start_to_end = FALSE,
  from_target = TRUE,
  include_tail = FALSE,
  .seed = NULL
)

Arguments

n

Numerischer Wert mit Anzahl der zu samplenden Ereignisse

int_start

POSIXct-Zeitstempel mit Startzeitpunkt des Sample-Zeitraums.

int_end

POSIXct-Zeitstempel mit Endzeitpunkt des Sample-Zeitraums.

offtime

Dataframe, der die Offtime-Ereignisse beinhaltet. Die Ereignisse sind anhand ihrer Start-/Endzeitpunkte beschrieben, die jeweils in den Spalten start und end uebergeben werden.

target_event

Dataframe, der die Zielereignisse beinhaltet. Die Ereignisse sind anhand ihrer Start-/Endzeitpunkte beschrieben, die jeweils in den Spalten start und end uebergeben werden.

target_cut_in_sec

Numerischer Wert mit der Laenge des Zeitfensters (in Sekunden), das vor jedem Zielereignis liegt und den Bereich der potentiell positiven Ereignisse umfasst.

event_length_in_sec

Numerischer Wert mit der Laenge der Ereignisse (in Sekunden).

event_overlap_in_sec

Numerischer Wert mit der Laenge des Intervalls (in Sekunden), in dem sich zwei aufeinanderfolgende Ereignisse ueberlappen duerfen (Default: 0, d.h. keine Ueberlappung erlaubt).

include_tail

Logischer Wert, ob Ereignisse nach dem letzten Zielereignis platziert werden koennen (Default: FALSE).

.seed

Numerischer Wert mit Seed-Wert, mit dem der Zufallsgenerator initialisiert wird. Darf auch NULL sein, dann wird zur Initialisierung die aktuelle Systemzeit herangezogen (Default: NULL, d.h. bei jedem Aufruf sollten unterschiedliche Ergebnisse erzeugt werden).

.max_run

Numerischer Wert mit Anzahl der Versuche, die je Ereignis unternommen werden sollen, um es im Zeitraum zu platzieren (Default: 1E3).

from_start_to_end

Logischer Wert, ob Ereignisse von int_start nach int_end erzeugt werden oder andersrum (Default: FALSE, d.h. es wird bei int_end begonnen).

from_target

Logischer Wert, ob Ereignisse von den Zielereignissen weglaufend erzeugt werden oder zu ihnen hinlaufend (Default: TRUE, d.h. sie laufen von den Zielereignissen weg). Die Richtung ist abhaengig von from_start_to_event).

Details

Waehrend positive Ereignisse nahe vor einem Zielereignis liegen, befinden sich negative Ereignisse ausserhalb dieser Bereiche (i.d.R. also weit vor einem bzw. nach einem Zielereignis). Die Ereignisse werden so von der Funktion platziert, dass das Verhaeltnis von positiven und negativen Ereignissen gleichverteilt ist und somit eine Klassenbalance hergestellt wird.

Der Gesamtzeitraum wird durch einen Start- und einen Endzeitpunkt festgelegt. In diesem Zeitraum koennen zusaetzliche Offtime-Intervalle definiert werden, in denen kein Sampling stattfindet (d.h. erzeugte Ereignisse ueberlappen sich nicht mit Offtimes). Neben der Ereignislaenge kann auch eine potentielle zeitliche Ueberlappung zwischen Ereignissen gesteuert werden. Um Klassenbalance herzustellen, wird weiterhin die Menge der Zielereignisse und die Laenge des Zeitfensters vor den Zielereignissen benoetigt. Um zusaetzlich bei sample_random_seq die zeitliche Ausrichtung der Ereignisse zu beeinflussen, kann deren Erzeugungsrichtung sowie ihre Orientierung bezueglich der Zielereignisse angepasst werden.

Value

Benannte Liste mit Dataframes mit zufaelligen, klassenbalancierten Ereignissen aus Zeitraum.

See Also

sample_random

Other Sampling-Funktionen: random_event(), sample_random()


dnlvgt/rktiq documentation built on Jan. 6, 2020, 10:26 p.m.