vignettes/wskazniki_z_danych_BDL.md

title: "Przygotowywanie wskaźników na podstawie Banku Danych Lokalnych GUS" author: "Tomasz Żółtak" date: "28 lutego 2019" lang: pl

1. Pobieranie wskaźników z API BDL

Pobieranie wskaźników z API BDL z wykorzystaniem funkcji pakietu MLASZdane przebiega w dwóch krokach:

  1. Wyszukanie wskaźników, które chce się pobrać przy pomocy funkcji znajdz_wskazniki_bdl() lub wskaznik_bdl().
  2. Pobranie wartości wyszukanych wcześniej wskaźników przy pomocy funkcji pobierz_dane_bdl().

1.1. Wyszukiwanie wskaźników

Wyszukiwanie wskaźników BDL przy użyciu API nie jest łatwe, ze względu na przyjęty przez GUS nie do końca spójny (a przynajmniej niezbyt wygodny) schemat nazywania wskaźników. Wskaźniki można bowiem podzielić na dwie grupy: te, które posiadają unikalne i informatywne nazwy oraz te, których nazwy są nieinformatywne i nie są unikalne (w szczególności wskaźniki o nazwie “ogółem”). Te pierwsze można łatwo wyszukiwać po nazwach (korzystając z odpowiedniej funkcji API), te drugie trzeba znajdować, przeszukując krok po kroku w głąb drzewiastą strukturę grup i podgrup wskaźników. Ponieważ to drugie podejście jest dosyć skomplikowane i słabo poddające się automatyzacji, w ramach pakietu zdecydowano się przyjąć następujące podejście:

Rozróżnienie wskaźników jednego i drugiego rodzaju w praktyce polega na sprawdzeniu, czy dany wskaźnik daje się znaleźć po nazwie, co do której spodziewamy się, że ją ma - jeśli się to nie udaje, najprawdopodobniej jest to wskaźnik drugiego rodzaju.

Przykładowe użycia:

library(MLASZdane)
znajdz_wskazniki_bdl("stopa bezrobocia rejestrowanego")
wskaznik_bdl(64428, "przeciętne miesięczne wynagrodzenia brutto")

1.2. Pobieranie zestawień wartości wskaźników

Do pobierania zestawień wartości wskaźników z API BDL służy funkcja pobierz_dane_bdl(), która przyjmuje następujące argumenty:

Funkcja zwraca ramkę danych o kolumnach:

Przykładowe użycia:

Uwaga! API BDL ma absurdalnie niskie limity na dopuszczalną w przedziale czasu liczbę zapytań, więc zapytanie takie jak poniżej można w praktyce wykonać tylko raz na 15 minut. w związku z tym zasadne jest zrobienie tego raz i zapisanie wyników lokalnie do wykorzystania w przyszłości (co w kodzie poniżej realizuje wywołanie funkcji save()).

library(dplyr)
library(MLASZdane)
wskaznikiBdl =
  bind_rows(znajdz_wskazniki_bdl("stopa bezrobocia rejestrowanego") %>%
              pobierz_dane_bdl(2017:2018, "powiaty"),
            wskaznik_bdl(64428, "przeciętne miesięczne wynagrodzenia brutto") %>%
              pobierz_dane_bdl(2017, "powiaty"))
save(wskaznikiBdl, file = "wskazniki_BDL.RData")

2. Przekształcanie zestawień pobranych z API BDL na zestawienia wskaźników wykorzystywanych w monitorowaniu losów absolwentów

Przekształcenie zestawień wskaźników pobranych z API BDL na zestawienia wskaźników wykorzystywanych w monitorowaniu losów absolwentów polega na zmianie formy zestawienia z długiej (jedna JST-wiele wierszy) na szeroką (jedna JST-jeden wiersz) oraz przypisaniu kolumnom takiego zestawienia w formie szerokiej adekwatnych nazw. Przekształcenia te wykonuje funkcja przeksztalc_dane_bdl(), przy czym w obecnej postaci ma ona kilka ważnych ograniczeń:

Nie ma gwarancji, że ww. reguły nie ulegną zmianie w przyszłości!

Nazwy zmiennych zawierających wartości wskaźników w zwracanym zestawieniu są postaci: jst_wskaznik_[[:digit:]]+[mr], gdzie:

Jeśli wszystkie wskaźniki w zestawieniu pobranym z API BDL przekazanym do funkcji są określone na tym samym poziomie agregacji, to w nazwach zmiennych ciąg znaków “jst” jest zamieniany na nazwę danego poziomu (np. “powiat”).

Przy wywołaniu funkcji konieczne jest podanie rocznika, w odniesieniu do którego przygotowane zostaną nazwy zmiennych (przy czym funkcja arbitralnie zakłada, że abolwenci powinni planowo kończyć szkołę w czerwcu).

Przy pomocy opcjonalnego argumentu prefiks możliwe jest też dopisanie do nazw zmiennych identyfikujących w wynikowym zestawieniu JST (terytnazwaJst) prefiksu, tak aby odpowiadały one nazwom zmiennych w zbiorze, do którego ma być przyłączane zestawienie.

Przykładowe użycie:

library(MLASZdane)
load("wskazniki_BDL.RData")
przeksztalc_dane_bdl(wskaznikiBdl, 2017)


tzoltak/MLASZdane documentation built on Aug. 10, 2021, 11:59 a.m.