analysis/01-import.R

library(readxl)
library(dplyr)

# Import data and labels
raw_dat <- read_excel("data-raw/rohdaten.xlsx", na = "NA")
labels <- read_excel("data-raw/rohdaten.xlsx", sheet = "labels")

# Convert to correct type
correct_type <- raw_dat %>%
  mutate_if(is.character, as.factor) %>%
  mutate_at("Anmerkung", as.character)

# Create proper factors for later display
refactored <- correct_type %>%
  mutate(v3 = factor(v3, levels = c("16", "17", "18", "19", "20-24", "25-29",
                                    "30-34", "35-39", "40-44", "45 u. älter")),
         v6 = factor(v6, levels = c("Ich nutze die Möglichkeiten des Internets intensiv und bin daher nicht auf ein Auto angewiesen",
                                    "Ich nutze Mitfahrgelegenheiten",
                                    "Ich halte die negativen Umweltfolgen des Autofahrens für zu gravierend",
                                    "Ich halte die negativen sozialen Folgen des Autofahrens für zu gravierend",
                                    "Ich habe Angst vorm Autofahren",
                                    "Ich habe keine Lust Auto zu fahren",
                                    "Ich bin gerade dabei den Führerschein zu machen",
                                    "Der Erwerb und die Instandhaltung/Betrieb eines Autos sind für mich zu kostenintensiv",
                                    "Ich bevorzuge es zu Fuß zu gehen",
                                    "Ich bevorzuge es mit dem Fahrrad zu fahren",
                                    "Ich bevorzuge die Nutzung öffentlicher Verkehrsmittel",
                                    "Ich bin derzeit zu beschäftigt bzw. habe zu wenig Zeit, um einen Führerschein zu machen",
                                    "Invalidität, gesundheitliche Probleme, Sehschwäche",
                                    "Rechtliche Umstände",
                                    "Andere Gründe")),
         v10 = factor(v10, levels = c("Universitätsabschluss",
                                      "FH-Abschluss",
                                      "Matura",
                                      "Berufsbildende Schule",
                                      "Lehrabschluss",
                                      "Pflichtschulabschluss")),
         v8 = factor(v8, levels = c("In weniger als einem Jahr",
                                    "In ein bis fünf Jahren",
                                    "In mehr als fünf Jahren",
                                    "Nie")))

# einzelne Fragebögen aussortieren
refactored <- refactored %>%
  filter(!id %in% c(6, 8, 10, 21, 39, 42, 46, 49, 74, 81))


# alter kategorisieren
refactored <- refactored %>%
  mutate(alter = case_when(as.numeric(.$v3) < 5 ~ "unter 20",
                         as.numeric(.$v3) > 6 ~ "30 oder älter",
                         TRUE ~ "20-29"),
       alter = factor(alter, levels = c("unter 20", "20-29", "30 oder älter")))

# Set attribute for better display
attr(refactored, "variable.labels") <- c(labels[["langname"]], "alter kategorisiert")

readr::write_rds(refactored, "data/refactored.rds")
tklebel/fuehrerschein documentation built on May 31, 2019, 3:43 p.m.