test_pkg_xgboost.R
In pdp: Partial Dependence Plots

# Load required packages
library(Matrix)

# Load Friedman benchmark data
friedman1 <- readRDS("friedman.rds")$friedman1
friedman2 <- readRDS("friedman.rds")$friedman2
X1 <- data.matrix(friedman1[, paste0("x.", 1L:10L)])
X1.dgCMatrix <- as(X1, "dgCMatrix")
X2 <- data.matrix(friedman2[, paste0("x.", 1L:10L)])

# For tuning, I just used xgbshap::autoxgb()

# Tests for package e1071
if (require(xgboost, quietly = TRUE)) {

  # Regression model -----------------------------------------------------------

  # Fit regression model
  fit1 <- xgboost(
    data = X1,
    label = friedman1$y,
    params = list(
      max_depth = 2,
      eta = 0.1,
      objective = "reg:squarederror",  # formerly "reg:linear"
      eval_metric = "rmse"
    ),
    nrounds = 827,
    verbose = 0,
    save_period = NULL
  )

  # Compute partial dependence, ICE, etc. for x.3
  pd1 <- partial(fit1, pred.var = "x.3", train = X1)
  ice1 <- partial(fit1, pred.var = "x.3", ice = TRUE, train = X1)

  # Expectations
  pdp1 <- partial(fit1, pred.var = "x.3", train = X1, plot = TRUE)
  pdp2 <- partial(fit1, pred.var = "x.3", train = X1, plot = TRUE,
                  plot.engine = "ggplot2")
  expect_true(inherits(pdp1, what = "trellis"))
  expect_true(inherits(pdp2, what = "ggplot"))
  expect_error(partial(fit1, pred.var = "x.3"))
  expect_true(inherits(pd1, what = "partial"))
  expect_true(inherits(ice1, what = "ice"))

  # Display plots side by side
  grid.arrange(pdp1, pdp2, nrow = 1)


  # Poisson model w/ log link --------------------------------------------------

  # Fit Poisson regression model for number of carburetors in the mtcars data
  # set (here, the response is a count)
  fit2 <- xgboost(
    data = data.matrix(mtcars[, -11L]),
    label = mtcars[, 11],
    objective = "count:poisson",
    eta = 0.1,
    nrounds = 273,
    verbose = 0,
    save_period = NULL
  )

  # FIXME: `predict.xgb.Booster()` now returns predictions on the original
  # response scale. To get the link scale, set `outputmargin = TRUE` in the call
  # to `predict.xgb.Booster()`. This can be passed via the `...` argument in the
  # call to `partial()`.

  # Passing a function to `inv.link` vs. not
  pd2.1 <- partial(fit2, pred.var = "mpg", train = mtcars[, -11L],
                   outputmargin = TRUE)
  pd2.2 <- partial(fit2, pred.var = "mpg", train = mtcars[, -11L],
                   outputmargin = FALSE)
  pd2.3 <- partial(fit2, pred.var = "mpg", inv.link = exp,
                   train = mtcars[, -11L], outputmargin = TRUE)
  pd2.4 <- partial(fit2, pred.var = "mpg", inv.link = exp,
                   train = mtcars[, -11L], outputmargin = TRUE, ice = TRUE)
  grid.arrange(autoplot(pd2.1), autoplot(pd2.2),
               autoplot(pd2.3), autoplot(pd2.4), nrow = 2)

  # Expectations
  expect_true(inherits(pd2.1, what = "partial"))
  expect_true(inherits(pd2.2, what = "partial"))
  expect_true(inherits(pd2.3, what = "partial"))


  # Classification model -------------------------------------------------------

  # Fit classification model
  fit3 <- xgboost(
    data = X2,
    label = ifelse(friedman2$y == "class1", 1, 0),
    params = list(
      max_depth = 25,
      eta = 0.1,
      objective = "binary:logistic",
      eval_metric = "auc"
    ),
    nrounds = 200,
    verbose = 0,
    save_period = NULL
  )

  # Compute partial dependence, ICE, etc. for x.3
  pd3 <- partial(fit3, pred.var = "x.3", train = X2)
  pd3.prob <- partial(fit3, pred.var = "x.3", prob = TRUE, train = X2)
  ice3 <- partial(fit3, pred.var = "x.3", ice = TRUE, train = X2)
  ice3.prob <- partial(fit3, pred.var = "x.3", ice = TRUE, prob = TRUE,
                       train = X2)

  # Expectations: partial()
  expect_true(inherits(pd3, what = "partial"))
  expect_true(inherits(pd3.prob, what = "partial"))
  expect_true(inherits(ice3, what = "ice"))
  expect_true(inherits(ice3.prob, what = "ice"))

}