knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>",
  eval = FALSE
)

Logique

Deroulement d'analyse

Le deroulement d'une analyse selon les directives d'analyse des donnees:

instructions de flux d'analyse

Son implementation dans hypegrammaR:

analysis flow hypegrammaR

Principales etapes

Toute analyse avec HypegrammaR suit la meme structure:

La grammaire est construite a partir de deux types d'elements: - "Blocks": Prend la sortie d'un mapping - "Mappings": decidez quoi faire, appelez un "bloc" qui le fait et renvoie un autre bloc.

Exemple

Une premiere fois (une fois seulement par machine):

remotes::install_github('ellieallien/hypegrammaR',build_opts = c())
remotes::install_github('mabafaba/surveyweights',build_opts = c())
remotes::install_github('mabafaba/koboquest',build_opts=c())

Une fois par evaluation

Charger le package hypegrammaR

library(hypegrammaR)

Chargez vos fichiers

Tous les fichiers d'entree sont attendus en tant que fichiers csv.

Chaque entree que nous attendons habituellement d'une evaluation a sa propre fonction pour la charger. Ils verifient que le format correspond a ce qui est attendu, s'assurent qu'ils fonctionnent bien les uns avec les autres et preparent la fonctionnalite pour laquelle ils sont utilises.

D'abord les donnees. Un fichier csv avec des donnees au format Kobo standard.

assessment_data<-load_data(file = "../data/testdata.csv")

Puis un sampling frame. Un fichier csv avec une colonne avec des noms de strates, une colonne avec des chiffres de population. Les noms de strates doivent correspondre exactement a certaines valeurs des donnees. Nous devons indiquer a la fonction de chargement quelle colonne est quoi dans le sampling frame.

sampling_frame<-load_samplingframe("../data/test_samplingframe.csv")

Enfin, le questionnaire, qui depend de la question et de la feuille de choix en tant que csv.

questionnaire<-load_questionnaire(data = assessment_data,
                                             questions = "../data/test_questionnaire_questions.csv",
                                             choices = "../data/test_questionnaire_choices.csv",
                                  choices.label.column.to.use = "label::English"
                                             )

Map pour ponderation

weighting <- map_to_weighting( sampling.frame = sampling_frame,
                               data.stratum.column = "stratification",
                               sampling.frame.population.column = "population",
                               sampling.frame.stratum.column = "strata.names",
                               data = assessment_data)

Pour chaque hypothese

Map au cas d'analyse

Tu dois savoir:

case <- map_to_case(hypothesis.type = "group_difference",
                    dependent.var.type = "numerical",
                    independent.var = "categorical")

Maintenant, mettez tout cela ensemble et Map le resultat:

result<-map_to_result(data = assessment_data,
              dependent.var = "number_simultaneous_unmet_need",
              independent.var =   "region",
              case = case,
              weighting = weighting)

Voir les resultats

La fonction map_to_result vous donne un certain nombre de choses:

Le message du journal

Tout d'abord, un message vous expliquant comment cela s'est passe:

# result$message

C'est ce que nous voulons voir. Si quelque chose ne va pas, cela devrait vous dire ici ce qui s'est pass?.

Meta-information

# result$parameters

Comme vous pouvez le constater, il se souvient de vos param?tres d'entr?e. Il a ?galement ajout? un nom normalis? du cas d'analyse.

Le resume statistique

# result$summary.statistic

Dans ce cas, les 'nombres' sont des moyennes, car la variable d'entree etait numerique. min etmax est l'intervalle de confiance correspondant. dependent.var.value donne les valeurs des variables correspondantes si elles sont cat?goriques (NA sinon.) Lee resume statistique sera toujours organis? avec exactement ces colonnes, quelle que soit l'analyse effectuee. Ainsi, si vous ajoutez une nouvelle visualisation ou un nouveau format de sortie, cela fonctionnera pour toutes les sorties de cette fonction.

Le test d'hypothese

Ensuite, vous trouverez des informations sur le test d'hypothese utilise (le cas echeant) et sur la p-valeur:

# result$hypothesis.test

Vous serez probablement plus interesse par la p-valeur et le type de test utilise.

Ajouter des etiquettes

Map aux sorties utilisables

Chart

chart<-map_to_visualisation(result)
heatmap<-map_to_visualisation_heatmap(result)
chart

Pour les utilisateurs avanc?s (qui connaissent ggplot): La fonction de visualisation retourne un objet ggplot afin que vous puissiez ajouter / remplacer des elements ggplot. par exemple:

# myvisualisation+coord_polar()

donner des labels

result %>% map_to_labeled(questionnaire) -> result_labeled
chart <- result_labeled %>% map_to_visualisation
heatmap <- result_labeled %>% map_to_visualisation_heatmap

Sauver sous forme de fichier

map_to_file(chart,"barchart.jpg")
map_to_file(result$summary.statistic,"summary_statistics.csv")


mabafaba/hypegrammaR documentation built on Oct. 2, 2019, 11:33 a.m.