View source: R/przewidywanie_rasch.R
przewidywanie_rasch | R Documentation |
Funkcja przygotowuje przeliczenie z sumy punktów na przewidywanie poziomu umiejętności z modelu IRT (żeby miało to większy sens powinna to być jakaś odmiana modelu Rascha).
przewidywanie_rasch(sumy, oszacowania, maks = NULL, span = 0.2)
sumy |
data frame zawierający id_obserwacji i obliczone sumy punktów (może to być kilka kolumn z sumami z kilku różnych części egzaminu) |
oszacowania |
data frame zawierający id_obserwacji i oszacowania umiejętności z modelu |
maks |
opcjonalnie wektor liczb zawierających maksymalne możliwe do
uzyskania wartości sum - jego elementy muszą nazywać się tak, jak kolumny
argumentu |
span |
wartość liczbowa - parametr |
W modelu Rascha liczba punktów w zasadzie powinna być statystyką dostateczną dla oszacowania poziomu umiejętności bez względu na to, czy test składa się wyłącznie z zadań ocenianych binarnie, czy też zawiera również zadania o większej liczbie poziomów wykonania. Niestety, w Mplusie tak nie jest i jeśli test zawiera zadania o większe liczbie poziomów wykonania, Mplus będzie przypisywał zdającym nieco inne oszacowania w zależności od tego, które konkretnie zadania rozwiązali poprawnie, a które niepoprawnie.
Jeśli napodstawie wyników działania Mplusa chcemy uzyskać funkcję przypisującą jednoznacznie oszacowanie sumie punktów, musimy w związku z tym dokonać jakiegoś przybliżenia. Możliwe są dwa podejścia:
Wygenerować wszystkie możliwe wektory odpowiedzi, na podstawie wyestymowanych parametrów modelu obliczyć odpowiadające im oszacowania oraz ich wiarygodność, a następnie agregować w ramach grup wyróżnionych ze względu na sumę punktów, z użyciem średniej ważonej wiarygodnością profilu (a więc wartością proporcjonalną do teoretycznej częśtości jego występowania).
Użyć oszacowań obliczonych na bardzo dużym zbiorze danych (rzeczywistym lub wygenerowanym metodą Monte-Carlo) i obliczyć średnie (już nieważone) oszacowań w ramach grup o tej samej wartości sumy.
Podejście pierwsze jest teoretycznie bardziej poprawne, ale znajduje zastosowanie tylko dla dosyć krótkich testów, jako że liczba wszystkich możliwych wektorów odpowiedzi rośnie wykładniczo wraz ze wzrostem liczby zadań. Podejście drugie jest aplikowalne zawsze, ale jego sensowność silnie zależy od iczby losowanych wyników (procedura Monte-Carlo) lub liczby obserwacji i rozkładu wyników (wykorzystanie danych rzeczywistych).
Niniejsza funkcja implementuje drugą procedurą, w oparciu o dane rzeczywiste (czyli w zasadzie najbardziej ryzykowną). Stara się przy tym wykryć i naprawić pewne problemy, które mogą się z nią wiązać:
niemonotoniczność przewidywań,
dziury w rozkładzie sumy.
Rozwiązanie obu problemów stara się uzyskać wygładzając i interpoulując
przewidywanie przy pomocy regresji nieparametrycznej (funkcją loess()
,
wywoływana z parametrem span
). Jeśli przewidywanie wynikające
z regesji nieparametrycznej jest niemonotoniczne, funkcja będzie zwiększać
wartość parametru span o 0.05 tak długo, aż przewidywanie stanie się
monotoniczne (wtedy zwórcone zostanie ostrzeżenie) lub aż osiągnieta zostanie
wartość parametru span
większa lub równa 1 (jeśli przewidywanie cały
czas będzie niemonotonicze, funkcja zwróci błąd).
Jeśli minimalna wartość występująca w danych nie jest równa 0, to wartościom niższym od najmniejszej występującej (w ramach danej grupy) przypisane zostanie przewidywanie odpowiadające tej minimalnej wartości sumy, występującej w danych (w ramach danej grupy).
Analogicznie, jeśli podana została wartość parametru maks
, to w ramach
każdej grupy ew. wartościom większym od maksymalnej wartości występującej
w danych (w ramach danej grupy) a nie większym od odpowiedniej wartości
parametru maks
przypisane zostaną przewidywania odpowiadające tej
maksymalnej wartości sumy, występującej w danych (w ramach danej grupy).
lista o elementach:
mapowanie
Data frame zawierający mapowanie sum na średnie
oszacowania. Kolumny o nazwach takich, jak kolumny w argumencie
sumy
(nie przechowujące id obserwacji) przyjmują wartość
TRUE
jeśli dany wiersz dotyczy posiadających wynik
z odpowiedniej części egzaminu lub wartość FALSE
, jeśli dany
wiersz dotyczy zdających, którzy nie posiadają wyniku z odpowiedniej
części egzaminu. Kolumna suma
opisuje sumę punktów łącznie
z wszystkich części (z których ktoś posiada wyniki), a ostatnia
kolumna zawiera wartość przewidywania.
przewidywania
Data frame zawierający zastosowanie ww.
mapowania do danych, z którymi wywołana została funkcja.
odsUtraconejWariancji
Odsetek wariancji oszacowań cechy
utracony w wyniku uśredniania.
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.