In mabafaba/hypegrammaR: A grammar of hypothesis test driven analysis

knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>",
  eval = FALSE
)

Logique

Deroulement d'analyse

Le deroulement d'une analyse selon les directives d'analyse des donnees:

instructions de flux d'analyse

Son implementation dans hypegrammaR:

analysis flow hypegrammaR

Principales etapes

Toute analyse avec HypegrammaR suit la meme structure:

Chargez vos donnees d'entree
decidez de vos parametres d'analyse
- quel type d'hypothese avez-vous?
- quelles sont les variables dependantes et independantes, et quels sont leurs types de donnees?

La grammaire est construite a partir de deux types d'elements: - "Blocks": Prend la sortie d'un mapping - "Mappings": decidez quoi faire, appelez un "bloc" qui le fait et renvoie un autre bloc.

map a partir de vos parametres principaux vers un * cas d'analyse * distinct.
map vos * entrees brutes * et * cas d'analyse * pour recevoir un * resultat d'analyse *
map votre * resultat * sur une * visualisation * / * un tableau * ou d'autres sorties appropri?es
map vos sorties dans un *fichier *

Exemple

Une premiere fois (une fois seulement par machine):

remotes::install_github('ellieallien/hypegrammaR',build_opts = c())
remotes::install_github('mabafaba/surveyweights',build_opts = c())
remotes::install_github('mabafaba/koboquest',build_opts=c())

Une fois par evaluation

Charger le package hypegrammaR

library(hypegrammaR)

Chargez vos fichiers

Tous les fichiers d'entree sont attendus en tant que fichiers csv.

Chaque entree que nous attendons habituellement d'une evaluation a sa propre fonction pour la charger. Ils verifient que le format correspond a ce qui est attendu, s'assurent qu'ils fonctionnent bien les uns avec les autres et preparent la fonctionnalite pour laquelle ils sont utilises.

D'abord les donnees. Un fichier csv avec des donnees au format Kobo standard.

assessment_data<-load_data(file = "../data/testdata.csv")

Puis un sampling frame. Un fichier csv avec une colonne avec des noms de strates, une colonne avec des chiffres de population. Les noms de strates doivent correspondre exactement a certaines valeurs des donnees. Nous devons indiquer a la fonction de chargement quelle colonne est quoi dans le sampling frame.

sampling_frame<-load_samplingframe("../data/test_samplingframe.csv")

Enfin, le questionnaire, qui depend de la question et de la feuille de choix en tant que csv.

questionnaire<-load_questionnaire(data = assessment_data,
                                             questions = "../data/test_questionnaire_questions.csv",
                                             choices = "../data/test_questionnaire_choices.csv",
                                  choices.label.column.to.use = "label::English"
                                             )

Map pour ponderation

weighting <- map_to_weighting( sampling.frame = sampling_frame,
                               data.stratum.column = "stratification",
                               sampling.frame.population.column = "population",
                               sampling.frame.stratum.column = "strata.names",
                               data = assessment_data)

Pour chaque hypothese

Map au cas d'analyse

Tu dois savoir:

Le type d'hypothese. Actuellement mis en ouvre sont:
direct_reporting
group_difference
limit
regression
les noms des colonnes qui sont vos variables dependantes et independantes

case <- map_to_case(hypothesis.type = "group_difference",
                    dependent.var.type = "numerical",
                    independent.var = "categorical")

Maintenant, mettez tout cela ensemble et Map le resultat:

result<-map_to_result(data = assessment_data,
              dependent.var = "number_simultaneous_unmet_need",
              independent.var =   "region",
              case = case,
              weighting = weighting)

Voir les resultats

La fonction map_to_result vous donne un certain nombre de choses:

un message de log
Meta-informations: un journal de vos entrees, quel cas d'analyse a ete utilise, etc.
Les statistiques recapitulatives (moyennes, pourcentages, etc.)
les resultats du test d'hypothese quand il s'applique
une visualisation

Le message du journal

Tout d'abord, un message vous expliquant comment cela s'est passe:

# result$message

C'est ce que nous voulons voir. Si quelque chose ne va pas, cela devrait vous dire ici ce qui s'est pass?.

Meta-information

# result$parameters

Comme vous pouvez le constater, il se souvient de vos param?tres d'entr?e. Il a ?galement ajout? un nom normalis? du cas d'analyse.

Le resume statistique

# result$summary.statistic

Dans ce cas, les 'nombres' sont des moyennes, car la variable d'entree etait numerique. min etmax est l'intervalle de confiance correspondant. dependent.var.value donne les valeurs des variables correspondantes si elles sont cat?goriques (NA sinon.) Lee resume statistique sera toujours organis? avec exactement ces colonnes, quelle que soit l'analyse effectuee. Ainsi, si vous ajoutez une nouvelle visualisation ou un nouveau format de sortie, cela fonctionnera pour toutes les sorties de cette fonction.

Le test d'hypothese

Ensuite, vous trouverez des informations sur le test d'hypothese utilise (le cas echeant) et sur la p-valeur:

# result$hypothesis.test

Vous serez probablement plus interesse par la p-valeur et le type de test utilise.

Ajouter des etiquettes

Map aux sorties utilisables

Chart

chart<-map_to_visualisation(result)
heatmap<-map_to_visualisation_heatmap(result)
chart

Pour les utilisateurs avanc?s (qui connaissent ggplot): La fonction de visualisation retourne un objet ggplot afin que vous puissiez ajouter / remplacer des elements ggplot. par exemple:

# myvisualisation+coord_polar()

donner des labels

result %>% map_to_labeled(questionnaire) -> result_labeled
chart <- result_labeled %>% map_to_visualisation
heatmap <- result_labeled %>% map_to_visualisation_heatmap

Sauver sous forme de fichier

map_to_file(chart,"barchart.jpg")
map_to_file(result$summary.statistic,"summary_statistics.csv")

mabafaba/hypegrammaR documentation built on Oct. 2, 2019, 11:33 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

mabafaba/hypegrammaR
A grammar of hypothesis test driven analysis

In mabafaba/hypegrammaR: A grammar of hypothesis test driven analysis

Logique

Deroulement d'analyse

Principales etapes

Exemple

Une premiere fois (une fois seulement par machine):

Une fois par evaluation

Charger le package hypegrammaR

Chargez vos fichiers

Map pour ponderation

Pour chaque hypothese

Map au cas d'analyse

Maintenant, mettez tout cela ensemble et Map le resultat:

Voir les resultats

Le message du journal

Meta-information

Le resume statistique

Le test d'hypothese

Ajouter des etiquettes

Map aux sorties utilisables

Chart

donner des labels

Sauver sous forme de fichier

R Package Documentation

Browse R Packages

We want your feedback!

mabafaba/hypegrammaR A grammar of hypothesis test driven analysis

In mabafaba/hypegrammaR: A grammar of hypothesis test driven analysis

Logique

Deroulement d'analyse

Principales etapes

Exemple

Une premiere fois (une fois seulement par machine):

Une fois par evaluation

Charger le package hypegrammaR

Chargez vos fichiers

Map pour ponderation

Pour chaque hypothese

Map au cas d'analyse

Maintenant, mettez tout cela ensemble et Map le resultat:

Voir les resultats

Le message du journal

Meta-information

Le resume statistique

Le test d'hypothese

Ajouter des etiquettes

Map aux sorties utilisables

Chart

donner des labels

Sauver sous forme de fichier

R Package Documentation

Browse R Packages

We want your feedback!

mabafaba/hypegrammaR
A grammar of hypothesis test driven analysis