univariate_anal_stats1: Dyskretyzuje zmienną i wylicza na niej statystyki

Description Usage Arguments See Also

View source: R/univariate.R

Description

W przypadku, gdy liczba unikalnych wartości zmiennej jest <= discrete_threshold lub zmienna nie jest zmienną numeryczną, uznaje że zmienna jest dyskretna i jedynie wylicza dla niej statystyki. W przeciwnym wypadku dyskretyzuje zmienną i wylicza statystyki.

Usage

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
univariate_anal_stats1(
  x,
  y,
  locfit = FALSE,
  discrete_threshold = numeric_var_treatment.params$discrete_threshold,
  NA_substit = numeric_var_treatment.params$NA_substit,
  special_val = numeric_var_treatment.params$special_val,
  no_stats_threshold = numeric_var_treatment.params$no_stats_threshold,
  max_gleb = 3,
  min_bucket = 200,
  interactive = FALSE,
  breaks = NULL,
  mapping = NULL,
  forceContinous = FALSE,
  span = 0.9,
  ...
)

Arguments

x

zmienna, po której procedura będzie sortować.

y

zmienna odpowiedzi.

locfit

Czy z automatu dopasować funkcję z modelu locfit.

discrete_threshold

jeśli liczba unikalnych wartości zmiennej jest nie większa ta wartość, zmienna uznana jest za dyskretną i nie jest poddawana dyskretyzacji.

NA_substit

wartość, którą zastąpić brak danych

special_val

Wartości specjalne do usunięcia z automatycznego podziału. Będą traktowane jako zmienne kategoryczne.

no_stats_threshold

liczba unikalnych wartości zmiennej kategorycznej, powyżej której nie są generowane statystyki. W przypadku przekroczenia, zwracany jest komunikat "Too many categorical levels".

max_gleb

Maksymalna głębokośc do której budujemy drzewo

min_bucket

Minimalna wielkość liścia

interactive

TRUE, jeśli zmienna ma być dyskretyzowana interaktywnie. W przeciwnym razie, co jest wartością domyślną, dyskretyzacja jest automatyczna.

breaks

zamiast automatycznego dzielenia, można podać wartości przedziałów (from,to].

mapping

zamiast automatycznego dzielenia, można podać mapowanie.

forceContinous

wymusza potraktowanie zmiennej jako ciągłą, mimo że liczba unikalnych wartości jest mniejsza niż discrete_threshold.

span

Parametr wygładzający funkcji locit.

...

dodatkowe parametry graficzne.

See Also

buckety_stat.


michaldanaj/MDBinom documentation built on June 13, 2020, 11:21 p.m.