knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>"
)

Pretext

Le package hypegrammaR impl?mente les [lignes directrices pour l'analyse de donn?es quantitatives IMPACT] (http://example.com). Bien que ce guide fonctionne de mani?re autonome, tout cela aura plus de sens si vous les lisez en premier.

De quoi as-tu besoin:

Obtenez d'abord tous vos fichiers au format csv:

_ REMARQUE IMPORTANTE: _ vos donn?es et votre questionnaire doivent ?tre conformes ? la sortie standard de style xml de kobo, sinon cela ne fonctionnera pas ou ne produira pas de r?sultats erron?s.

  • en-t?tes de colonne inchang?s
  • noms des questionnaires inchang?s
  • valeurs xml (NON ?tiquet?es)
  • Les questions select_multiple ont une colonne avec toutes les r?ponses concat?n?es (s?par?es par un espace "") et une colonne pour chaque r?ponse nomm?e [nom de la question]. [nom du choix]

Votre base de sondage doit ?tre au bon format:

  • doit avoir une ligne par strate; une colonne pour les chiffres de population; une colonne pour les noms de strates
  • Les valeurs de la colonne avec les noms de strates doivent appara?tre exactement identiques dans une colonne des donn?es

Preparation

Installer le paquet hypegrammaR

Sur cette ligne, vous devez uniquement ex?cuter once lors de la premi?re utilisation de hypegrammaR ou effectuer la mise ? jour vers une nouvelle version.

remotes::install_github("ellieallien/hypegrammaR",build_opts = c())

(le build_opts = c () assure que le paquet inclut toutes les pages d'aide suppl?mentaires et la documentation) Pour cette ?tape seulement, vous avez besoin d'une connexion Internet plus ou moins stable.

Charger le paquet hypegrammaR

library(hypegrammaR)

Chargez vos fichiers

Les donn?es

load_data ne prend qu'un seul argumentfile, le chemin du fichier csv.

assessment_data<-load_data(file = "../data/testdata.csv")

Conditions:

Charger la base de sondage

Ceci n'est n?cessaire que si l'analyse doit ?tre pond?r?e.

La base de sondage doit ?tre un fichier csv avec une colonne avec les noms de strates, une colonne avec les num?ros de population. load_samplingframe ne prend qu'un seul argumentfile, le chemin d'acc?s au fichier csv.

sampling_frame<-hypegrammaR::load_samplingframe(file = "../data/test_samplingframe.csv")

Maintenant, convertissez votre sampling frame en une fonction de pond?ration avec map_to_weighting. Nous voyons que les colonnes pertinentes de la base de sondage s'appellent "noms de strates" et "population". La colonne dans les donn?es correspondant aux noms de strates est appel?e "stratification" dans cet ensemble de donn?es. Nous devons fournir ces noms de colonne comme arguments de map_to_weighing:

myweighter<-map_to_weighting(sampling.frame = sampling_frame,
                             data.stratum.column = "stratification",
                             sampling.frame.population.column = "population",
                             sampling.frame.stratum.column = "strata.names", 
                             data = assessment_data)

Le questionnaire

Enfin, le questionnaire, qui d?pend de la question et de la feuille de choix en tant que csv. hypegrammaR peut vivre sans cela, mais un questionnaire est n?cessaire pour une analyse correcte des questions select_multiple.

Les param?tres sont:

questionnaire<- koboquest::load_questionnaire(data = assessment_data,
                                  questions = "../data/test_questionnaire_questions.csv",
                                  choices = "../data/test_questionnaire_choices.csv",
                                  choices.label.column.to.use = "label::English"
                                             )

Conditions:

Une analyse

Identifiez vos param?tres d'analyse

map pour le cas d'analyse

Pour cet exemple, notre hypoth?se est que les m?nages des quartiers informels ont re?u une assistance diff?rente de celle des quartiers non informels.

my_case<-map_to_case(hypothesis.type = "group_difference",
                  dependent.var.type = "categorical",
                  independent.var.type =  "categorical")

Vous pouvez savoir ce que vous pouvez / devez entrer exactement pour ces param?tres en ex?cutant ? Map_to_case, ce qui ouvrira la page d'aide pour la fonction (cela fonctionne pour n'importe quelle fonction)

Lancer l'analyse

Maintenant, vous utilisez les entr?es charg?es ci-dessus pour un r?sultat d'analyse:

assistance_informal_settlements<-map_to_result(data = assessment_data,
                      dependent.var = "assistancereceived",
                      independent.var = 'informalsettlement',
                      case = my_case,
                      weighting = myweighter,
                      questionnaire = questionnaire)

Montrer les r?sultats

Premi?rement, nous ajoutons des ?tiquettes au r?sultat (en supposant que vous ayez charg? un questionnaire):

assistance_informal_settlements<-map_to_labeled(result = assistance_informal_settlements,
                                                questionnaire = questionnaire)

Enfin, nous pouvons obtenir des visualisations, des tableaux, etc.:

chart<- map_to_visualisation(assistance_informal_settlements)
table<-map_to_table(assistance_informal_settlements)
chart
table

Sauvegarder / exporter les r?sultats

Pour sauvegarder / exporter les r?sultats, vous pouvez utiliser la fonction g?n?rique map_to_file. Par exemple:

# map_to_file(results$summary.statistics,"summary_stat.csv")
# map_to_file(myvisualisation,"barchart.jpg",width="5",height="5")

Vous trouverez les fichiers dans votre r?pertoire de travail actuel (que vous pouvez trouver avec getwd ())

?chantillons stratifi?s

Pour la pond?ration, nous utiliserons le paquet surveyweights d'IMPACT. Il a ?t? install? quand vous avez install? hypegrammaR. Charge le:

# library(surveyweights)

Pour les ?chantillons stratifi?s, nous devons fournir un sampling frame.

# mysamplingframe<-read.csv("../tests/testthat/test_samplingframe.csv")

Le sampling frame doit comporter exactement une ligne par strate; une colonne pour les noms de strates, une colonne pour les chiffres de population. Notre exemple de trame de donn?es ressemble ? ceci:

# head(mysamplingframe)

Les noms doivent correspondre exactement aux valeurs d'une colonne de donn?es. dans ce cas, il s'agit de ?mydata $ stratification?.

# head(mydata$stratification)

Nous pouvons maintenant cr?er un objet "pond?r?":

# myweighter<-weighting_fun_from_samplingframe(sampling.frame = mysamplingframe,
#                                              data.stratum.column = "stratification",
#                                              sampling.frame.population.column = "population",
#                                              sampling.frame.stratum.column = "strata.names")

Maintenant, nous pouvons utiliser analyse_indicator comme avant, mais transmettons le poids que nous venons de cr?er, ainsi la pond?ration sera appliqu?e (faites attention au dernier argument):

# result<-analyse_indicator(
#                   data = mydata,
#                   dependent.var = "nutrition_need",
#                   independent.var = "region",
#                   hypothesis.type = "group_difference",
#                   independent.var.type = "categorical",
#                   dependent.var.type="numerical",
#                   weighting = myweighter)


# result$summary.statistic

?chantillons de cluster

sans pond?ration suppl?mentaire

Si les cluster n'ont pas besoin d'?tre pond?r?es (en plus des strates), il vous suffit d'indiquer analyse_indicator quelle variable de donn?es identifie la grappe:

# result<-analyse_indicator(
#                   data = mydata,
#                   dependent.var = "nutrition_need",
#                   independent.var = "region",
#                   hypothesis.type = "group_difference",
#                   independent.var.type = "categorical",
#                   dependent.var.type="numerical",
#                   weighting = myweighter,
#                   cluster.variable.name = "village")

Avec pond?ration suppl?mentaire

Si la classification est fournie avec ses propres pond?rations (si les probabilit?s de s?lection des enregistrements de diff?rentes grappes de la m?me strate sont diff?rentes), vous devez charger la base de sondage de la m?me mani?re que pour la stratification, puis combiner les deux fonctions de pond?ration. :

# samplingframe2<-read.csv("../tests/testthat/test_samplingframe2.csv")
# 
# myweighting_cluster<-weighting_fun_from_samplingframe(samplingframe2,
#                                                     data.stratum.column = "village",
#                                                     sampling.frame.population.column = "populations",
#                                                     sampling.frame.stratum.column = "village.name")
# 

# combined_weighting<-combine_weighting_functions(myweighing,myweighting_cluster)

# result<-analyse_indicator(
#                   data = mydata,
#                   dependent.var = "nutrition_need",
#                   independent.var = "region",
#                   hypothesis.type = "group_difference",
#                   independent.var.type = "categorical",
#                   dependent.var.type="numerical",
#                   weighting = combined_weighting,
#                   cluster.variable.name = "village")

Utilisation du questionnaire

Si nous chargeons davantage le questionnaire, nous pourrons faire des choses tr?s int?ressantes:

Chargement du questionnaire

require("koboquest")
# questionnaire<- load_questionnaire(mydata,
#                               questions.file = "../tests/testthat/kobo questions.csv",
#                               choices.file = "../tests/testthat/kobo choices.csv")



# result<-analyse_indicator(mydata,
#                   dependent.var = "accesstomarket",
#                   independent.var = "region",
#                   dependent.var.type = "categorical",
#                   independent.var.type = "categorical",
#                   hypothesis.type = "group_difference",
#                   weighting=myweighter)


# vis<-map_to_visualisation(result)


mabafaba/hypegrammaR documentation built on Oct. 2, 2019, 11:33 a.m.