demo/demo_subsubclass.R
In contextual: Simulation and Analysis of Contextual Multi-Armed Bandit Policies

library(contextual)

BasicPoissonBandit <- R6::R6Class(
  inherit = BasicBernoulliBandit,
  class = FALSE,
  public = list(
    weights = NULL,
    class_name = "BasicPoissonBandit",
    # Override get_reward & generate Poisson based rewards
    get_reward = function(t, context, action) {
      reward_means = rep(2,self$k)
      rpm <- rpois(self$k, reward_means)
      rewards <- matrix(rpm < self$weights, self$k, 1)*1
      optimal_arm    <- which_max_tied(self$weights)
      reward         <- list(
        reward                   = rewards[action$choice],
        optimal_arm              = optimal_arm,
        optimal_reward           = rewards[optimal_arm]
      )
    }
  )
)

EpsilonGreedyAnnealingPolicy <- R6::R6Class(
  # Class extends EpsilonGreedyPolicy
  inherit = EpsilonGreedyPolicy,
  portable = FALSE,
  public = list(
    class_name = "EpsilonGreedyAnnealingPolicy",
    # Override EpsilonGreedyPolicy's get_action, use annealing epsilon
    get_action = function(t, context) {
      self$epsilon <- 1/(log(100*t+0.001))
      super$get_action(t, context)
    }
  )
)

weights <- c(7,1,2)
horizon <- 200
simulations <- 1000
bandit <- BasicPoissonBandit$new(weights)
ega_policy <- EpsilonGreedyAnnealingPolicy$new()
eg_policy  <- EpsilonGreedyPolicy$new(0.2)
agents <- list(Agent$new(ega_policy, bandit, "EG Annealing"),
               Agent$new(eg_policy, bandit, "EG"))
simulation <- Simulator$new(agents, horizon, simulations, do_parallel = TRUE)
history <- simulation$run()

plot(history, type = "cumulative", no_par = TRUE, legend_border = FALSE,
     legend_position = "bottomright")

Any scripts or data that you put into this service are public.

contextual documentation built on July 26, 2020, 1:06 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

contextual
Simulation and Analysis of Contextual Multi-Armed Bandit Policies

demo/demo_subsubclass.R
In contextual: Simulation and Analysis of Contextual Multi-Armed Bandit Policies

Try the contextual package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

contextual Simulation and Analysis of Contextual Multi-Armed Bandit Policies

demo/demo_subsubclass.R In contextual: Simulation and Analysis of Contextual Multi-Armed Bandit Policies

Try the contextual package in your browser

R Package Documentation

Browse R Packages

We want your feedback!

contextual
Simulation and Analysis of Contextual Multi-Armed Bandit Policies

demo/demo_subsubclass.R
In contextual: Simulation and Analysis of Contextual Multi-Armed Bandit Policies