vignettes/runda_pilotazowa-dokumentacja.md

title: "Przetwarzanie zbiorów z pilotażowej rundy monitoringu" author: "Tomasz Żółtak" date: "27 października 2017" lang: pl

1. Wprowadzenie

1.1. Funkcja wczytaj_wyniki_pilrm()

Na podstawie zbioru z badania absolwentów (MLEZAMiD_absolwent_n2959_20171013.sav) funkcja wczytaj_wyniki_pilrm() zwraca listę ramek danych (zbiorów) zawierającą następujące elementy:

1.2. Funkcja imputuj_miesiac_pk_pilrm()

Funkcja imputuj_miesiac_pk_pilrm() przetwarza listę zbiorów danych, zwróconą przez wczytaj_wyniki_pilrm() i zwraca listę zbiorów danych o dokładnie takiej samej strukturze (p. wyżej).

Metody imputacji wartości zmiennych opisujących moment rozpoczęcia i moment zakończenia epizodów opisane zostały szczegółowo w sekcji 3. tego dokumentu.

1.3. Funkcja przygotuj_zbior_osobo_miesiecy_pilrm()

Funkcja przygotuj_zbior_osobo_miesiecy_pilrm() przetwarza listę zbiorów danych, zwróconą przez imputuj_miesiac_pk_pilrm() i zwraca ramkę danych (zbiór) zawierający dane o epizodach nauki, pracy i bezrobocia przekształcone do postaci osobo-miesięcy (obserwacją jest osoba w danym miesiącu).

Struktura zbioru i sposób jego tworzenia zostały szczegółowo opisane w sekcji 6. tego dokumentu.

1.4. Identyfikator respondenta

Identyfikatorem respondenta w zbiorach jest zmienna ID (W oryginalnym zbiorze danych z wynikami badania absolwentów zmienna ta nazywa się ID_IBE).

2. Struktura zbioru danych epizodów

2.1. Zmienne specjalne w zbiorze epizodów

Aby możliwe było łatwiejsze identyfikowanie interesujących nas w analizie epizodów, w zbiorze utworzone zostały specjalne zmienne (znajdują się na początku zbioru):

2.2. Różnice w nazwach i etykietach względem oryginalnego zbioru SPSS

2.3. Epizody dotyczące zdawania do szkół policealnych lub na studia

2.4. Epizody pracy

3. Imputacja wartości zmiennych czas_rozp i czas_kon

Imputacji brakujących wartości zmiennych czas_rozpczas_kon dla epizodów typu ‘praca’ i ‘bezrobocie’ dokonano przy użyciu modeli regresji liniowej.

3.1. Zmienna czas_rozp

3.2. Zmienna czas_kon

4. Zbiór z informacjami o członkach gospodarstw domowych

5. Uwagi o analizie zbioru epizodów

Typowo zbiór epizodów wykorzystywane będzie w analizie w ten sposób, że:

Należy mieć przy tym na uwadze, że znaczna część respondentów mogła nie mieć żadnego epizodu właśnie analizowanego typu. W szczególności oznacza to, że:

6. Zbiór z danymi w postaci osobo-miesięcy

6.1. Struktura zbioru

W zbiorze zawarte zostały następujące zmienne opisujące cechy respondentów stałe w czasie:

W zbiorze zawarte zostały następujące zmienne opisujące statusy respondentów w poszczególnych miesiącach:

6.2. Okres objęty obserwacjami w zbiorze

6.3. Sposób kodowania statusów

6.3.1. Reguły klasyfikacji na podstawie epizodów obejmujących poszczególne miesiące

6.3.2. Uwzględnienie ciągłości nauki (przez okres wakacji)

Jeśli stwierdzono, że respondent:

wszystkie miesiące (włącznie) od czerwca do odpowiednio września lub sierpnia, w których respondent nie zadeklarował, że się uczył, oznaczane były jako okres odpowiednio studiowania (nauka równe 2) lub nauki w szkole policealnej (nauka równe 3).

Kodowanie na podstawie niewystępowania epizodów obejmujących dany miesiąc

6.4. Relacje pomiędzy statusami pracy i nauki a statusem bezrobocia

W ramach przyjętego schematu kodowania nie narzucano wzajemnego wykluczania się niezerowych (tj. wskazującymi na aktywność zawodową lub edukacyjną) wartości zmiennych pracanaukaniezerowymi wartościami zmiennej bezrobocie (wskazującymi na pozostawaniu bez zatrudnienia). W związku z występowaniem w zbiorze rekordów, w których statusy wskazują jednocześnie na bezrobocie (lub nieaktywność zawodową) i aktywność zawodową lub naukę, należy rozważyć, że:

  1. Po dużej części są to sytuacje, które mogły mieć miejsce:
    • Jeśli przejście od bezrobocia do pracy lub odwrotnie odbyło się w środku miesiąca, respondent istotnie był w danym miesiącu zarówno pracujący, jak i bezrobotny (wiersze w zbiorze, w których najprawdopodobniej mamy do czynienia z taką sytuacją wyróżnione są przez wartość ‘miesiąc graniczny’ zmiennej praca_a_bezrobocie).
    • Jeśli respondent pracował na czarno, mógł jednocześnie być formalnie bezrobotny (choć w zbiorze nie odnotowujemy tego typu deklaracji).
    • Postrzeganie się w kategoriach osoby bezrobotnej może być dla części respondentów oderwane od faktu kontynuowania lub nie nauki.
  2. W sytuacjach, gdy zidentyfikowano konflikt statusu pracy i bezrobocia, niedający się zinterpretować w kategoriach miesiąca granicznego, starano się je jeszcze rozstrzygnąć, biorąc pod uwagę, że niektóre statusy zostały przypisane na podstawie imputowanych wartości zmiennych czas_rozpczas_kon i w związku z tym można je uznać za mniej wiarygodne.
    • Jeśli w danym miesiącu (dla danego respondenta) status pracy wskazujący na aktywność zawodową został zakodowany na podstawie imputowanych wartości zmiennych czas_rozpczas_kon, a status bezrobocia wskazujący na brak pracy został zakodowany w oparciu o deklaracje respondenta dot. miesiąca rozpoczęcia lub zakończenia epizodu (bezrobocia), status zatrudnienia był zmieniany na brak zatrudnienia. Sytuacje takie oznaczone są w zbiorze wartością ‘skorygowano pracę’ zmiennej praca_a_bezrobocie.
    • Jeśli w danym miesiącu (dla danego respondenta) status bezrobocia wskazujący na brak pracy został zakodowany na podstawie imputowanych wartości zmiennych czas_rozpczas_kon, a status zatrudnienia wskazujący aktywność zawodową został zakodowany w oparciu o deklaracje respondenta dot. miesiąca rozpoczęcia lub zakończenia epizodu (pracy), status bezrobocia był zmieniany na ‘nie bezrobotny’. Sytuacje takie oznaczone są w zbiorze wartością ‘skorygowano bezrobocie’ zmiennej praca_a_bezrobocie.
    • W innych przypadkach nie dało się dokonać korekt. Są one oznaczone w zbiorze wartościami ‘sprzeczne deklaracje resp.’ lub ‘sprzeczne wyniki imputacji’ zmiennej praca_a_bezrobocie, w zależności od tego, czy oba statusy zostały określone na podstawie informacji o miesiącu rozpoczęcia lub zakończenia epizodu podanych przez respondenta, czy też oba zostały przypisane na podstawie imputowanych wartości zmiennych czas_rozpczas_kon.
  3. W ogólności nie mamy niestety gwarancji, że respondenci odpowiadali w sposób spójny. W ramach wywiadu nie mieliśmy bowiem możliwości wyłapywania ew. konfliktów w deklaracjach na bieżąco i zmuszania respondentów do ich rozstrzygnięcia.
    • Być może w przyszłości chcąc badać historie życia respondentów, należałoby pomyśleć o zagwarantowaniu sobie, że firma realizująca je w terenie będzie używać bardziej wyspecjalizowanego pod tym kątem oprogramowania do realizacji.

6.5. Warto przemyśleć przed przystąpieniem do analiz



tzoltak/MLASZdane documentation built on Aug. 10, 2021, 11:59 a.m.