library(here)
library(tidyverse)
library(kableExtra)
source(here("R","data_predvyzkum.R"), encoding = "UTF-8")
source(here("R","data_csu_psc.R"), encoding = "UTF-8")
data <- jednotky_oddily_kmeny_predvyzkum()

Kolik jednotek jakých typů bylo v datech (pro kontrolu)

data %>% group_by(typ_jednotky) %>% summarize(pocet = length(unique(ev_cislo)))
data <- normalizovat_mesto_psc(data)
data <- pripojit_csu_data(data)

Samplovat dle kategorii

Střediska jsme seskupili do kategorií dle "regionu" (Morava, Čechy, + Sever = Ústecký + Karlovarský kraj, protože mi přijde specifický :-) ), velikosti obce, zda má k roku 2017 registrovaný kmen a kolik má členů v roverském věku (18-26) (rozděleno na tři třetiny dle počtu členů).

Některé kategorie obsahovly jen pár středisek a tak jsme je sloučili do skupin.

strediska <- data %>% filter(typ_jednotky == "stredisko" & clenove_celkem > 0) #Dve strediska nemaji registraci, mozna jsou v likvidaci nebo tak neco
if(any(is.na(strediska$lau_obec))) stop("Nektera strediska nemaji LAU obec")

strediska <- strediska %>% 
  mutate(velikost_obce = cut(obyvatele, c(0,10000,100000,2000000), labels = c("do 10 tis","10-100 tis", "nad 100 tis")),
         clenove_category = cut(clenove_celkem, c(-1, quantile(clenove_celkem, probs = c(0.33,0.66)), 10000), labels = c("Malo", "Stredne", "Hodne")),
         region = if_else(nuts_kraj %in% c("CZ080","CZ072","CZ071","CZ064"), "Morava", 
                          if_else(nuts_kraj %in% c("CZ041","CZ042"), "Sever", "Čechy")
            )
         ) 

strediska_kategorie <- strediska %>%
  group_by(region, ma_kmen, velikost_obce, clenove_category) %>% summarize(pocet = length(ev_cislo)) %>%
  ungroup() %>%
  mutate(id_kategorie = 1:nrow(.))

strediska_kategorie 

cat_map <- strediska_kategorie$id_kategorie
cat_map[41:44] <- 41
cat_map[38:40] <- 38
#37 muze byt samostatne
cat_map[34:36] <- 34
cat_map[31:33] <- 31 
cat_map[28:30] <- 28
cat_map[25:27] <- 25
cat_map[22:24] <- 22
cat_map[19:21] <- 19
cat_map[16:18] <- 16
cat_map[13:15] <- 13
cat_map[10:11] <- 10
cat_map[7:8] <- 7
cat_map[4:5] <- 4
cat_map[2:3] <- 2

strediska_kategorie <- strediska_kategorie %>%
  mutate(skupina_id = cat_map) 

#strediska_kategorie %>% group_by(region, ma_kmen, skupina_id) %>% summarize(pocet = sum(pocet))

strediska <- strediska %>% inner_join(strediska_kategorie, by = c("ma_kmen", "velikost_obce", "clenove_category", "region"))

Vylosovaná střediska

Z každé skupiny jsme vylosovali 5 středisek. Chtělo by to zkontaktovat alespoň 1 z každé skupiny, ideálně 2. Ostatní tam jsou jako náhrada, kdybyste se někam nedovolali/odmítli vás.

set.seed(231485)
for(group in unique(strediska_kategorie$skupina_id)) {
  cat("Skupina ", group,"- kategorie stredisek\n") 
  print(strediska_kategorie %>% filter(skupina_id == group) %>% select(-id_kategorie,-skupina_id))
  cat("Skupina ", group,"- vylosovana strediska\n")  
  strediska %>% filter(skupina_id == group) %>% sample_n(5) %>% select(ev_cislo, nazev_jednotky, pocet_roveru, clenove_celkem, ma_kmen, web) %>% kable("html") %>% kable_styling(bootstrap_options = "condensed") %>% print()
}


martinmodrak/revize-rs documentation built on March 9, 2021, 5:30 a.m.