-- Encoding:UTF-8 --

Default template in French for Rmd

< header


title: "Import des données" author: "Nom de l'auteur" date: "30 juin 2014" output: html_document: number_sections: yes toc: yes pdf_document: toc: yes


# Warning: encoding = UTF-8
# Load ggplot2 package to plot
library(ggplot2)

# Create a label function to access easly to labels
# without using label function from packages
# like those from Hmisc
label <- function(object) attr(x = object, which = "label")

Import du tableau de données

Tableau de données au format Excel.

library(openxlsx)
rep_rawdata <- read.xlsx( "rep_path_to_database")

Changer les noms de colonnes avec ceux définis dans le cahier de variable

colnames(rep_rawdata) <-  rep_columns_names

Créer une copie du tableau de variable pour le nettoyage

rep_cleandata <- rep_rawdata

Nettoyage variable par variable

> header

< numeric

< factor

< ordered

< integer

< date

< not_used

rep_rname

Description

Exploration des données brutes

head(rep_rawdata$rep_rname, 10)

Transformation

> not_used

> numeric

> factor

> integer

> ordered

> date

< not_used

Variable non utilisée dans l'analyse. A supprimer

rep_cleandata$rep_rname <- NULL

> not_used

< numeric

rep_cleandata$rep_rname <- as.numeric(rep_rawdata$rep_rname)

> numeric

< integer

rep_cleandata$rep_rname <- as.integer(rep_rawdata$rep_rname)

> integer

< factor

rep_cleandata$rep_rname <- factor(
  x = rep_rawdata$rep_rname,
  levels = rep_levels,
  labels = rep_names
)

> factor

< ordered

rep_cleandata$rep_rname <- factor(
  x = rep_rawdata$rep_rname,
  levels = rep_levels,
  labels = rep_names,
  ordered = TRUE
)

> ordered

< date

rep_cleandata$rep_rname <- as.Date(
  x = rep_rawdata$rep_rname, 
  format = "rep_unit"
)

> date

<--- Check import --->

< numeric

< factor

< ordered

< integer

< date

Ajouter un label (étiquette).

attr(rep_cleandata$rep_rname, "label") <- "rep_varlabel"

Vérifier

# Premières données
head(rep_cleandata$rep_rname, 10)

# Résumé
summary(rep_cleandata$rep_rname)

# Graphique
qplot(rep_cleandata$rep_rname, xlab = label(rep_cleandata$rep_rname))

> numeric

> factor

> integer

> ordered

> date

< footer

Exploration globale

Recherche de données manquantes graphiquement

library(dfexplore)
dfplot(rep_cleandata)

Sauvegarder

donnees <- rep_cleandata
save(donnees, file = "donnees.RData")

> footer



jomuller/vartors documentation built on May 19, 2019, 7:26 p.m.