library(RefManageR) BibOptions(check.entries = FALSE, bib.style = "authoryear", cite.style = "authoryear", style = "markdown", hyperlink = FALSE, dashed = FALSE) myBib <- ReadBib("./readings.bib", check = FALSE)
Digitalisierung bedeutet: Wir leben in einer datenreichen Zeit. Es gibt Daten wie Sand am Meer. So sind auch die Dimensionen digitaler Textdaten im Sinne von „Big Data“ überwältigend. Um aber die Materialflut bewältigen und ordnen zu können, sind neue digitale Wege zu gehen. In dieser Veranstaltung werden wir daher Verfahren des „Text Mining“ nutzen, um große Textdaten-Sammlungen (d.h. Korpora) effizient mit Algorithmen zu analysieren.
Die Tore in die Welt der maschinellen Textverarbeitung öffnen sich allerdings erst, wenn man in der Lage ist, analytische Ideen in Programm-Code zu gießen. Daten sind das neue Öl? Man muss programmieren können, um aus dem neuen wertvollen Rohstoff "Daten" etwas herausholen zu können.
Daher verbindet dieser Kurs eine Einführung in das wissenschaftliche Programmieren - konkret in die Statistiksprache „R“ - mit einer anwendungsorientierten Einführung in Verfahren des Text Mining. Dabei können wir auf die Daten und Analyse-Tools des PolMine-Projekts (polmine.de) zurückgreifen. Mit dem Korpus aller Debatten im Deutschen Bundestag („GermaParl“) und den UCSSR-Online-Foliensätze (für „Using Corpora in Social Science Research“) stehen Ihnen Ressourcen zur Verfügung, mit denen Sie schnell relevante politikwissenschaftliche Erkenntnisse erzielen können.
Als Voraussetzung müssen Sie keinerlei Programmierkenntnisse mitbringen - nur Offenheit und etwas Leidensfähigkeit, Code mit geschweiften und eckigen Klammern zu schreiben. Indem Sie am Ende des Kurses über "data literacy" und Grundlagen des Programmierens verfügen, werden Sie die Welt der Digitalisierung besser verstehen. Die Abgeschiedenheit, welche die Corona-Krise erzwingt, können Sie als beste Gelegenheit nutzen, dieses Wagnis einzugehen!
Warum es generell keine schlechte Idee ist
Code is everywhere / Macht der Algorithmen / "code is law" r Citep(myBib, "Lessig1999")
Code schreiben ist nicht teuer, sondern günstig(er)
Code schreiben als Kulturtechnik
--
Warum wissenschaftlich programmieren?
Begrenzte Flexibilität von GUIs (graphical user interfaces)
Reproduzierbarkeit der Forschuung
Gerade bei Analyse großer Textdaten: Code schreiben unumgänglich
Code schreiben emanzipiert
--
Warum man das lieber lassen sollte? Es kann ein fürchterlicher Zeitfresser sein!
Tutorials
Projekte:
Eine sehr kurze Geschichte von R
--
R hat Vorteile!
R hat Nachteile ..
background-image: url(img/Le_28_juillet.jpg) background-size: cover class: nobackground, inverse
.attribution[E. Delacroix / Wikimedia]
.pull-center[# Warum R?
Freiheit -Gleichheit - Brüderlichkeit!]
Wie gut kennen Sie Ihren Rechner?
--
--
--
--
--
--
--
Und was folgt daraus für meine nächste Kaufentscheidung?
Kann ich eigentlich mit R auf meinem Tablet arbeiten?
GitHub Issues
Anforderungen
Bearbeitung von Übungsaufgaben => "Auszeichnungen" und "Badges"
Projektarbeit am Ende:
PrintBibliography(myBib)
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.