knitr::opts_chunk$set(echo = TRUE)
more on tidy data
Guerrilla Analytics Principles als kapstok
knitr::include_graphics( here::here( "images", "phd_final1.png" ) )
knitr::include_graphics( here::here( "images", "phd_final2.png" ) )
knitr::include_graphics( here::here( "images", "phd_final3.png" ) )
Maar gaat met data niet heel anders. wat kan je doen om dat te voorkomen?
knitr::include_graphics( here::here( "images", "EC_FAIR_data.png" ) )
projectnaam │ README.md │ metadata.txt └───analyse │ │ analyse_projectnaam.R │ └───data │ | │ datalog.txt │ | │ data295834.csv │ | └───v1 │ | │ | data295834.csv │ └───data_raw │ │ originaldatafile1.txt │ │ originaldatafile2.txt │ └───verslag │ paper_projectnaam.docx
knitr::include_graphics( here::here( "images", "open_data_challenges.png" ) )
net als alles wat je maakt kan je aan je data een kaartje hangen met uitleg over wat mensen er van jou wel en niet mee mogen doen.
knitr::include_graphics( here::here( "images", "Understanding-Creative-Commons-Licenses-20.png" ) )
Van wie is deze cursus?
It's complicated, maar ga niet zomaar akkoord met "niet open, want we hebben er niet over nagedacht en het klinkt eng"
Maar alleen de data delen is niet genoeg.
knitr::include_graphics( here::here( "images", "laderast_metadata.png" ) )
image credit: I got this slide from Ted Laderas
Stel je voor: we willen twee datasets combineren van twee instellingen die hetzelde experiment hebben uitgevoerd: A) Theme hospital B) bejaardentehuis Avondrood.
In het experiment werd getest of een bepaald medicijn ervoor zorgt dat mensen afvallen, in vergelijking met een placebo. Deelnemers zijn gewogen voor en na behandeling.
| patient | locatie | gewicht_voor | gewicht_na | |---------|----------------|--------------|------------| | A | Theme Hospital | 64 | 62 | | B | Theme Hospital | 71 | 70 |
Welke metadata zou je willen hebben als je de datasets wilt combineren?
Denk aan details op experiment-niveau, niet deelnemer-niveau (dus bijvoorbeeld: wat was de tijd tussen de twee meetpunten? Was dat op beide locaties hetzelfde?)
(dank aan Ted Laderas voor de opdracht)
| metadata | should be in data | |-------------------------------|------------------------| | tijdpad experiment | leeftijd participanten | | afgenomen door wie | andere medicijnen? | | soort weegschaal | | | dosis medicijn | | | naam project | | | welke variabelen zijn gemeten | | | waar is de data? | | | protocol | | | informed consent formulieren | |
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.