multimput: Using Multiple Imputation to Address Missing Data

test_that("handles lm", {
  set.seed(20220120)
  dataset <- generate_data(n_year = 10, n_site = 10, n_run = 1)
  dataset$Count[sample(nrow(dataset), 10)] <- NA
  dataset$fYear <- factor(dataset$Year)
  dataset$fPeriod <- factor(dataset$Period)
  dataset$fSite <- factor(dataset$Site)
  dataset$Bottom <- 10000
  n_imp <- 10L
  model <- lm(Count ~ Year + factor(Period) + factor(Site), data = dataset)
  expect_is(
    imputed <- impute(model, dataset),
    "rawImputed"
  )
  expect_identical(ncol(imputed@Imputation), 19L)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))
  expect_identical(imputed@Minimum, "")

  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp),
    "rawImputed"
  )
  expect_identical(ncol(imputed@Imputation), n_imp)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))

  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
  expect_identical(imputed@Minimum, "Bottom")
  expect_identical(imputed@Extra, na.omit(dataset)[1, ])

  expect_error(
    impute(model, dataset, minimum = "Junk"),
    "object@Data does not have .*name.*Junk"
  )
})







test_that("handles inla with gaussian distribution", {
  if (!require(INLA)) {
    skip("INLA package not available")
  }
  set.seed(20220120)
  dataset <- generate_data(n_year = 10, n_site = 10, n_run = 1)
  dataset$Count[sample(nrow(dataset), 10)] <- NA
  dataset$fYear <- factor(dataset$Year)
  dataset$fPeriod <- factor(dataset$Period)
  dataset$fSite <- factor(dataset$Site)
  dataset$Bottom <- 10000
  n_imp <- 10L
  model <- INLA::inla(
    Count ~ factor(Year) + factor(Period) + f(Site, model = "iid"),
    data = dataset,
    control.compute = list(config = TRUE),
    control.predictor = list(compute = TRUE, link = 1)
  )
  expect_is(imputed <- impute(model, parallel_configs = FALSE), "rawImputed")
  expect_identical(ncol(imputed@Imputation), 19L)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))
  expect_identical(imputed@Minimum, "")

  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp, parallel_configs = FALSE),
    "rawImputed"
  )
  expect_identical(ncol(imputed@Imputation), n_imp)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))

  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", parallel_configs = FALSE,
      extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
  expect_identical(imputed@Minimum, "Bottom")
  expect_identical(imputed@Extra, na.omit(dataset)[1, ])

  expect_error(
    impute(model, dataset, minimum = "Junk", parallel_configs = FALSE),
    "object@Data does not have .*name.*Junk"
  )
})





test_that("handles inla with negative binomial distribution", {
  if (!require(INLA)) {
    skip("INLA package not available")
  }
  set.seed(20220120)
  dataset <- generate_data(n_year = 10, n_site = 10, n_run = 1)
  dataset$Count[sample(nrow(dataset), 10)] <- NA
  dataset$fYear <- factor(dataset$Year)
  dataset$fPeriod <- factor(dataset$Period)
  dataset$fSite <- factor(dataset$Site)
  dataset$Bottom <- 10000
  n_imp <- 10L
  model <- INLA::inla(
    Count ~ factor(Year) + factor(Period) + f(Site, model = "iid"),
    data = dataset,
    family = "nbinomial",
    control.compute = list(config = TRUE),
    control.predictor = list(compute = TRUE, link = 1)
  )
  expect_is(imputed <- impute(model, parallel_configs = FALSE), "rawImputed")
  expect_identical(ncol(imputed@Imputation), 19L)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))
  expect_identical(imputed@Minimum, "")

  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp, parallel_configs = FALSE),
    "rawImputed"
  )
  expect_identical(ncol(imputed@Imputation), n_imp)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))

  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", parallel_configs = FALSE,
      extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
  expect_identical(imputed@Minimum, "Bottom")
  expect_identical(imputed@Extra, na.omit(dataset)[1, ])

  expect_error(
    impute(model, dataset, minimum = "Junk", parallel_configs = FALSE),
    "object@Data does not have.*name.*Junk"
  )
})





test_that("handles inla with poisson distribution", {
  if (!require(INLA)) {
    skip("INLA package not available")
  }
  set.seed(20220120)
  dataset <- generate_data(n_year = 10, n_site = 10, n_run = 1)
  dataset$Count[sample(nrow(dataset), 10)] <- NA
  dataset$fYear <- factor(dataset$Year)
  dataset$fPeriod <- factor(dataset$Period)
  dataset$fSite <- factor(dataset$Site)
  dataset$Bottom <- 10000
  n_imp <- 10L
  model <- INLA::inla(
    Count ~ factor(Year) + factor(Period) + f(Site, model = "iid"),
    data = dataset, family = "poisson",
    control.compute = list(config = TRUE),
    control.predictor = list(compute = TRUE, link = 1)
  )
  expect_is(imputed <- impute(model, parallel_configs = FALSE), "rawImputed")
  expect_identical(ncol(imputed@Imputation), 19L)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))
  expect_identical(imputed@Minimum, "")

  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp, parallel_configs = FALSE),
    "rawImputed"
  )
  expect_identical(ncol(imputed@Imputation), n_imp)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))

  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", parallel_configs = FALSE,
      extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
  expect_identical(imputed@Minimum, "Bottom")
  expect_identical(imputed@Extra, na.omit(dataset)[1, ])

  expect_error(
    impute(model, dataset, minimum = "Junk", parallel_configs = FALSE),
    "object@Data does not have.*name.*Junk"
  )
})


















test_that("handles inla with zeroinflatednbinomial1 distribution", {
  if (!require(INLA)) {
    skip("INLA package not available")
  }
  set.seed(20230327)
  dataset <- generate_data(n_year = 10, n_site = 10, n_run = 1)
  dataset$Count[sample(nrow(dataset), 10)] <- NA
  dataset$fYear <- factor(dataset$Year)
  dataset$fPeriod <- factor(dataset$Period)
  dataset$fSite <- factor(dataset$Site)
  dataset$Bottom <- 10000
  n_imp <- 10L
  model <- INLA::inla(
    Count ~ factor(Year) + factor(Period) + f(Site, model = "iid"),
    data = dataset, family = "zeroinflatednbinomial1",
    control.compute = list(config = TRUE),
    control.predictor = list(compute = TRUE, link = 1)
  )
  expect_is(imputed <- impute(model, parallel_configs = FALSE), "rawImputed")
  expect_identical(ncol(imputed@Imputation), 19L)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))
  expect_identical(imputed@Minimum, "")

  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp, parallel_configs = FALSE),
    "rawImputed"
  )
  expect_identical(ncol(imputed@Imputation), n_imp)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))

  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", parallel_configs = FALSE,
      extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
  expect_identical(imputed@Minimum, "Bottom")
  expect_identical(imputed@Extra, na.omit(dataset)[1, ])

  expect_error(
    impute(model, dataset, minimum = "Junk", parallel_configs = FALSE),
    "object@Data does not have.*name.*Junk"
  )
})


test_that("handles inla with zeroinflatedpoisson0 distribution", {
  if (!require(INLA)) {
    skip("INLA package not available")
  }
  set.seed(20230327)
  dataset <- generate_data(n_year = 10, n_site = 10, n_run = 1)
  dataset$Count[sample(nrow(dataset), 10)] <- NA
  dataset$fYear <- factor(dataset$Year)
  dataset$fPeriod <- factor(dataset$Period)
  dataset$fSite <- factor(dataset$Site)
  dataset$Bottom <- 10000
  n_imp <- 10L
  model <- INLA::inla(
    Count ~ factor(Year) + factor(Period) + f(Site, model = "iid"),
    data = dataset, family = "zeroinflatedpoisson0",
    control.compute = list(config = TRUE),
    control.predictor = list(compute = TRUE, link = 1)
  )
  expect_is(imputed <- impute(model, parallel_configs = FALSE), "rawImputed")
  expect_identical(ncol(imputed@Imputation), 19L)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))
  expect_identical(imputed@Minimum, "")

  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp, parallel_configs = FALSE),
    "rawImputed"
  )
  expect_identical(ncol(imputed@Imputation), n_imp)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))

  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", parallel_configs = FALSE,
      extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
  expect_identical(imputed@Minimum, "Bottom")
  expect_identical(imputed@Extra, na.omit(dataset)[1, ])

  expect_error(
    impute(model, dataset, minimum = "Junk", parallel_configs = FALSE),
    "object@Data does not have.*name.*Junk"
  )
})









test_that("handles inla with zeroinflatedpoisson1 distribution", {
  if (!require(INLA)) {
    skip("INLA package not available")
  }
  set.seed(20230327)
  dataset <- generate_data(n_year = 10, n_site = 10, n_run = 1)
  dataset$Count[sample(nrow(dataset), 10)] <- NA
  dataset$fYear <- factor(dataset$Year)
  dataset$fPeriod <- factor(dataset$Period)
  dataset$fSite <- factor(dataset$Site)
  dataset$Bottom <- 10000
  n_imp <- 10L
  model <- INLA::inla(
    Count ~ factor(Year) + factor(Period) + f(Site, model = "iid"),
    data = dataset, family = "zeroinflatedpoisson1",
    control.compute = list(config = TRUE),
    control.predictor = list(compute = TRUE, link = 1)
  )
  expect_is(imputed <- impute(model, parallel_configs = FALSE), "rawImputed")
  expect_identical(ncol(imputed@Imputation), 19L)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))
  expect_identical(imputed@Minimum, "")

  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp, parallel_configs = FALSE),
    "rawImputed"
  )
  expect_identical(ncol(imputed@Imputation), n_imp)
  expect_identical(nrow(imputed@Imputation), sum(is.na(dataset$Count)))

  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", parallel_configs = FALSE,
      extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
  expect_identical(imputed@Minimum, "Bottom")
  expect_identical(imputed@Extra, na.omit(dataset)[1, ])

  expect_error(
    impute(model, dataset, minimum = "Junk", parallel_configs = FALSE),
    "object@Data does not have.*name.*Junk"
  )
})

test_that("handles datasets without missing observations", {
  n_imp <- 19L
  set.seed(20220120)
  dataset <- generate_data(n_year = 10, n_site = 50, n_run = 1)
  dataset$Bottom <- 10000
  expect_identical(
    sum(is.na(dataset$Count)),
    0L
  )
  model <- lm(Count ~ Year + factor(Period) + factor(Site), data = dataset)
  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp),
    "rawImputed"
  )
  expect_identical(
    ncol(imputed@Imputation),
    n_imp
  )
  expect_identical(
    nrow(imputed@Imputation),
    sum(is.na(dataset$Count))
  )
  expect_identical(
    imputed@Minimum,
    ""
  )

  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
  expect_identical(imputed@Minimum, "Bottom")
  expect_identical(imputed@Extra, na.omit(dataset)[1, ])

  expect_error(
    impute(model, dataset, minimum = "Junk"),
    "object@Data does not have.*name.*Junk"
  )

  if (!require(INLA)) {
    skip("INLA package not available")
  }
  model <- inla(
    Count ~ Year + factor(Period) + factor(Site),
    data = dataset,
    family = "nbinomial",
    control.compute = list(config = TRUE)
  )
  expect_is(
    imputed <- impute(
      model, dataset, minimum = "Bottom", parallel_configs = FALSE,
      extra = na.omit(dataset)[1, ]
    ),
    "rawImputed"
  )
})





test_that("is robust for wrong imput", {
  n_imp <- 19L
  set.seed(20220100)
  dataset <- generate_data(n_year = 10, n_site = 50, n_run = 1)
  dataset$Bottom <- 10000
  dataset$fPeriod <- factor(dataset$Period)
  dataset$fSite <- factor(dataset$Site)
  dataset$fYear <- factor(dataset$Year)
  dataset$Count[sample(nrow(dataset), 5)] <- NA
  expect_error(
    impute(model = "junk"),
    "can't handle a model of class character at this moment."
  )
  model <- lm(Count ~ Year + factor(Period) + factor(Site), data = dataset)
  expect_error(
    impute(model = model, data = "junk"),
    "data does not inherit from class data.frame"
  )
  expect_error(
    impute(model = model, data = dataset, n_imp = -1),
    "n_imp is not a count"
  )
  expect_error(
    impute(model = model, data = dataset, n_imp = 0),
    "n_imp is not a count"
  )
  expect_error(
    impute(model = model, data = dataset, n_imp = "junk"),
    "n_imp is not a count"
  )
  wrong_dataset <- dataset
  wrong_dataset$Year <- NULL
  expect_error(
    impute(model = model, data = wrong_dataset),
    "object 'Year' not found"
  )
  wrong_dataset <- dataset
  wrong_dataset$Count <- NA_real_
  expect_error(
    impute(model = model, data = dataset, extra = wrong_dataset),
    "Response variable in `Extra` contains `NA` values."
  )
  wrong_dataset$Count <- NULL
  expect_error(
    impute(model = model, data = wrong_dataset),
    "data does not have.*name.*Count"
  )
  expect_error(
    impute(model = model, data = dataset, extra = 1L),
    "`extra` is not a `data.frame`"
  )

  model <- lme4::glmer(
    Count ~ factor(Year) + fPeriod + (1 | fSite),
    data = dataset,
    family = poisson
  )
  expect_error(impute(model, dataset), "impute can't handle factor")
  expect_error(
    impute(model = model, data = "junk"),
    "data does not inherit from class data.frame"
  )
  expect_error(
    impute(model = model, data = dataset, n_imp = -1),
    "n_imp is not a count"
  )
  expect_error(
    impute(model = model, data = dataset, n_imp = 0),
    "n_imp is not a count"
  )
  expect_error(
    impute(model = model, data = dataset, n_imp = "junk"),
    "n_imp is not a count"
  )

  model <- lme4::glmer(
    Count ~ fYear + fPeriod + (1 | fSite),
    data = dataset,
    family = poisson
  )
  wrong_dataset <- dataset
  wrong_dataset$fPeriod <- NULL
  expect_error(
    impute(model = model, data = wrong_dataset),
    "object 'fPeriod' not found"
  )
  wrong_dataset <- dataset
  wrong_dataset$Count <- NULL
  expect_error(
    impute(model = model, data = wrong_dataset),
    "data does not have.*name.*Count"
  )

  model <- lme4::glmer(
    Count ~ fYear + fPeriod + (1 | Site),
    data = dataset,
    family = poisson
  )


  if (!require(INLA)) {
    skip("INLA package not available")
  }
  model <- INLA::inla(
    Count ~ factor(Year) + factor(Period) + f(Site, model = "iid"),
    data = dataset, family = "nbinomial", control.predictor = list(link = 1)
  )
  expect_error(
    impute(model),
"model must be fit with the 'config = TRUE' argument of control.compute"
  )
  model <- INLA::inla(
    Count ~ factor(Year) + factor(Period) + f(Site, model = "iid"),
    data = dataset,
    family = "nbinomial2",
    control.compute = list(config = TRUE),
    control.predictor = list(link = 1)
  )
  expect_error(
    impute(model, parallel_configs = FALSE),
    "Imputations from the 'nbinomial2' family not yet defined"
  )
})

test_that("handles glmerMod objects", {
  set.seed(20220100)
  n_imp <- 10L
  dataset <- generate_data(
    n_year = 10,
    n_site = 50,
    n_run = 1,
    year_factor = TRUE,
    period_factor = TRUE,
    site_factor = TRUE
  )
  dataset$Count[sample(nrow(dataset), 50)] <- NA
  dataset$Bottom <- 10000
  model <- lme4::glmer(
    Count ~ Year + Period + (1 | Site),
    data = dataset,
    family = poisson
  )
  expect_is(
    imputed <- impute(model, dataset),
    "rawImputed"
  )
  expect_identical(
    ncol(imputed@Imputation),
    19L
  )
  expect_identical(
    nrow(imputed@Imputation),
    sum(is.na(dataset$Count))
  )

  expect_is(
    imputed <- impute(model, dataset, n_imp = n_imp),
    "rawImputed"
  )
  expect_identical(
    ncol(imputed@Imputation),
    n_imp
  )
  expect_identical(
    nrow(imputed@Imputation),
    sum(is.na(dataset$Count))
  )
  expect_identical(
    imputed@Minimum,
    ""
  )

  expect_is(
    imputed <- impute(model, dataset, minimum = "Bottom"),
    "rawImputed"
  )
  expect_identical(
    imputed@Minimum,
    "Bottom"
  )

  expect_error(
    impute(model, dataset, minimum = "Junk"),
    "object@Data does not have.*name.*Junk"
  )
})
inbo/multimput documentation built on Sept. 17, 2023, 4:35 a.m.
rdrr.io home R language documentation Run R code online
CRAN packages Bioconductor packages R-Forge packages GitHub packages
Note that we can't provide technical support on individual packages. You should contact the package authors for that.
inbo/multimput
Using Multiple Imputation to Address Missing Data

tests/testthat/test_ab_impute.R
In inbo/multimput: Using Multiple Imputation to Address Missing Data

R Package Documentation

Browse R Packages

We want your feedback!

inbo/multimput Using Multiple Imputation to Address Missing Data

tests/testthat/test_ab_impute.R In inbo/multimput: Using Multiple Imputation to Address Missing Data

R Package Documentation

Browse R Packages

We want your feedback!

inbo/multimput
Using Multiple Imputation to Address Missing Data

tests/testthat/test_ab_impute.R
In inbo/multimput: Using Multiple Imputation to Address Missing Data