Home

/

GitHub

/

ablaette/learningR

/

In ablaette/learningR: Slides and Supplementary Material to Get Started with R

Datenformate und Tabellen Revisited

Man wird sich an eine Reihe von Datenformaten gewöhnen müssen:
txt (plain text)
csv / tsv (comma separated values / tab separated values)
json (für Web-Technologien verbreitet)
XML (eXtended Markup Language)
Es gibt Alternativen zum "base R" data.frame:
tibble (verbesserte Ausgabe)
data.table (Vermeidung des Kopierens von Daten)
Das dplyr-Paket bietet ein weit verbreitetes Vokabular zur Arbeit mit Tabellen
Mind the tidyverse!

Artithmetische Operatoren (Wdh.)

Mit arithmetischen Operatoren kann man mit Vektoren rechnen

| Operator | Description | |----------|--------------| | + | addition | | - | subtraction | | * | multiplication | | / | division | | ^ or ** | exponentiation |

Beachte: Länge des zweiten Vektors muss entweder 1 oder identisch mit der des ersten Vektors sein.
Die Reihenfolge der Anwendung arithmetischer Operatoren lässt sich durch Klammern steuern => Umsetzung von Formeln wie in der gängigen mathematischen Notation´

Logische Operatoren

| Operator | Description | |----------|-------------| | < | kleiner als / less than | | <= | kleiner gleich / less than or equal to | | > | größer als / greater than | | >= | größer gleich / greater than or equal to | | == | exakt gleich / exactly equal to | | != | ungleich / not equal to | | !x | nicht x / Not x | | x & y | x UND y / x AND y | | isTRUE(x) | ist wahr? / test if X is TRUE |

Beachte: Logische Operatoren werden auf Vektoren angewendet, das Ergebnis kann ein logischer Vektor der Länge > 1 sein
Oft ist der Operator %in% nützlich, um das Auftreten der Elemente eines Vektors in einem zweiten Vektor zu prüfen

Kontrollstrukturen: if-else

schokolade <- c("milka", "lindt", "ritter-sport", "alpia", "schogetten")
schokolade[4] == "alpia"

if (schokolade[5] != "alpia"){
  print("her mit dem zeug")
} else {
  print("bleib mir weg damit")
}

Beachte:
Zeilenumbrüche werden so gesetzt, dass dies die Lesbarkeit des Codes optimiert
geschweifte Klammern können entfallen, wenn der auszuführende Ausdruck aus nur einer Funktion besteht
Abfragen können beliebig mit else if erweitert werden´

Kontrollstrukturen: for-Schleifen

einfaches Iterieren durch einen numerischen Vektor

for (i in c(1,2,3,4,5)) print(i) # auch für character vectors, logische vektoren

oft sieht mqn dies: Iteration durch eine Zahlenreihe

for (i in 1:5){ print(i) }

man kann auch durch einen character vector iterieren

for (i in c("a", "b", "c")){ print(i) }

und dabei kann natürlich der Vektor schon früher definiert worden sein

for (schoki in schokolade) print(schoki)

oft arbeitet man auch mit der Indizierung eines Vektors

for (i in 1:length(schokolade)) print(schokolade[i])

Verknüpfung von Kontrollstrukturen

Hier ein ganz einfaches Szenario, das man aber in der Praxis oft nutzen kann: Iteration durch einen Vektor und Durchführung einer Anweisung, wenn eine bestimmte Bedingung erfüllt ist.

for (schoki in schokolade){
  if (schoki == "alpia"){
    print("großer jubel")
  } else {
    print("weg damit!!!!")
  }  
}

Definition von Funktionen

add_one <- function(x){x + 1}
add_one(1)

add_anything <- function(x, y){x + y}
add_anything(5, 5)

Beachte: Der letzte Ausdruck einer Funktion fungiert als Rückgabewert
Beim Aufruf einer Funktion kann die Benennung der Argumente entfallen

Funktionen II

Argumente können "default values" haben

add_anything_default <- function(x, y = 2){
  x + y
}
add_anything_default(x = 5)
add_anything_default(x = 5, 3)
add_anything_default(x = 5, y = 6)

Funktionen richtig anwenden

Warum es gut ist, Funktionen zu verstehen ... Ein kleines Szenario:

tab <- read.table(
  "https://opendata-duisburg.de/sites/default/files/Corona%2030.04.2020.csv",
  sep = ";"
)
tab[1:5,]

Was muss man tun, um eine ordentliche Tabelle zu importieren?

Funktionen und Pipes

Insbesondere im "tidyverse"-Ökosystem sind Verkettungen von Funktionsaufrufen über "Pipes" gängig. Hier wird der Rückgabewert einer Funktion zum ersten Argument der nachfolgenden Funktion, die mit dem Pipe-Operator %>% angebunden wird.

library(magrittr)
tab <- read.table("https://opendata-duisburg.de/sites/default/files/Corona%2030.04.2020.csv", sep = ";", header = TRUE)
tab[["Datum"]] <- as.Date(tab[["Datum"]], format = "%d.%m.%Y ")
tab %>%
  subset(Datum >= as.Date("2020-04-01")) %>%
  barplot(height = .[["X.Aktuell.infiziert"]])

Ausblick: sapply

es ist kaum etwas so "Rish" wie lapply

lapply(1:3, function(x){x + 1})
sapply(1:3, function(x){x + 1})

Einsatz: Splitten einer Tabelle entsprechend eines Vektors, Anwendung einer Funktion und Re-Kombination

Aufgabe

Analysieren Sie die Altersstruktur der Wähler_innen der Parteien bei der Bundestagswahl 2017 mit dem GLES-Datensatz. Legen Sie dafür ein mehrseitiges pdf-Dokument an: Auf jeder Seite soll ein Törtchen-Diagramm den prozentualen Anteil einer Alterskohorte zeigen.

Tip: Vermutlich werden Sie mit einer Schleife arbeiten? Bevor eine Schleife durchgeführt wird, öffnen Sie ein pdf-Dokument.

pdf(file = tempfile())

Dieses muss dann am Ende geschlossen werden ...

dev.off()

ablaette/learningR documentation built on July 1, 2023, 1:11 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

ablaette/learningR
Slides and Supplementary Material to Get Started with R

In ablaette/learningR: Slides and Supplementary Material to Get Started with R

Datenformate und Tabellen Revisited

Artithmetische Operatoren (Wdh.)

Logische Operatoren

Kontrollstrukturen: if-else

Kontrollstrukturen: for-Schleifen

Verknüpfung von Kontrollstrukturen

Definition von Funktionen

Funktionen II

Funktionen richtig anwenden

Funktionen und Pipes

Ausblick: sapply

Aufgabe

R Package Documentation

Browse R Packages

We want your feedback!

ablaette/learningR Slides and Supplementary Material to Get Started with R

In ablaette/learningR: Slides and Supplementary Material to Get Started with R

Datenformate und Tabellen Revisited

Artithmetische Operatoren (Wdh.)

Logische Operatoren

Kontrollstrukturen: if-else

Kontrollstrukturen: for-Schleifen

Verknüpfung von Kontrollstrukturen

Definition von Funktionen

Funktionen II

Funktionen richtig anwenden

Funktionen und Pipes

Ausblick: sapply

Aufgabe

R Package Documentation

Browse R Packages

We want your feedback!

ablaette/learningR
Slides and Supplementary Material to Get Started with R