R/awsirregular.r
In aws: Adaptive Weights Smoothing

Documented in aws.irreg

aws.irreg <- function(y,
                      x,
                      hmax = NULL,
                      aws = TRUE,
                      memory = FALSE,
                      varmodel = "Constant",
                      lkern = "Triangle",
                      aggkern = "Uniform",
                      sigma2 = NULL,
                      nbins = 100,
                      hpre = NULL,
                      henv = NULL,
                      ladjust = 1,
                      varprop = .1,
                      graph = FALSE)
{
  #
  #    first check arguments and initialize
  #
  args <- match.call()
  n <- length(y)
  dx <- dim(x)
  if (is.null(dx))
    d <- 1
  else
    d <- dx[2]
  if (!(d %in% 1:2))
    stop("this version is for 1D and 2D only")
  if ((d == 1 &&
       length(x) != length(y)) ||
      (d == 2 && dx[1] != n))
    stop("incorrect size of x")
  if (!(varmodel %in% c("Constant", "Linear", "Quadratic")))
    stop("Model for variance not implemented")
  #
  #   binning for variance estimation
  #
  zbins <- binning(x, y, nbins = rep(n ^ (1 / d) / 2, d))
  given.var <- !is.null(sigma2)
  if (!given.var) {
    sigma20 <-
      mean(zbins$devs[zbins$x.freq > 1] / (zbins$x.freq[zbins$x.freq > 1] - 1))
    cat("Preliminary variance estimate:", sigma20, "\n")
    vcoef <- sigma20
  } else {
    vcoef <- mean(sigma2)
  }
  if (is.null(nbins))
    nbins <- n ^ (1 / d) / 2
  if (length(nbins) < d)
    nbins <- rep(nbins[1], d)
  zbins <- binning(x, y, nbins = nbins)
  ni <- zbins$table.freq
  xmin <- if (d == 1)
    min(zbins$x)
  else
    apply(zbins$x, 2, min)
  xmax <- if (d == 1)
    max(zbins$x)
  else
    apply(zbins$x, 2, max)
  mask <- ni > 0
  if (!is.null(henv)){
    mask <- .Fortran(C_mask,
      as.integer(mask),
      mask = as.integer(mask),
      as.integer(nbins[1]),
      as.integer(switch(d, 1, nbins[2])),
      as.integer(max(0, henv))
    )$mask
    mask <- as.logical(mask)
  }
  yy <- rep(mean(y), length(mask))
  dim(yy) <- dim(mask) <- dim(ni)
  if (d > 1 & graph) {
    oldpar <- par(
      mfrow = c(1, 3),
      mar = c(3, 3, 3, .2),
      mgp = c(2, 1, 0)
    )
    image(mask,
          col = grey((0:255) / 255),
          xaxt = "n",
          yaxt = "n")
    title("compute estimates on mask ")
    par(oldpar)
  }
  cat("compute estimates in ",
      sum(mask),
      " out of ",
      length(mask),
      " bins\n")
  if (sum(mask) < length(mask))
    cat("increase parameter henv (= ",
        henv,
        ") if full coverage is needed\n")
  yy[ni > 0] <- zbins$means
  nn <- length(yy)
  if (given.var) {
    if (length(sigma2) != nn)
      sigma2 <- rep(sigma2[1], nn)
    sigma2 <- 1 / sigma2
  } else {
    sigma2 <- 1 / rep(sigma20, nn)
  }
  if (d == 2)
    wghts <-
    c(diff(range(x[, 1])) / diff(range(x[, 2])) / nbins[1] * nbins[2], 0)
  else
    wghts <- c(0, 0)
  if (d == 2)
    dy <- dim(yy) <- dim(sigma2) <- nbins[1:2]
  #
  #   set appropriate defaults
  #
  cpar <-
    setawsdefaults(dim(yy),
                   mean(y),
                   "Gaussian",
                   lkern,
                   aggkern,
                   aws,
                   memory,
                   ladjust,
                   hmax,
                   1,
                   wghts)
  lkern <- cpar$lkern
  lambda <- 2 * cpar$lambda # Gaussian case
  maxvol <- cpar$maxvol
  k <- cpar$k
  kstar <- cpar$kstar
  cpar$tau1 <- cpar$tau1 * 2
  cpar$tau2 <- cpar$tau2 * 2
  hmax <- cpar$hmax
  shape <- cpar$shape
  cpar$heta <- 20 ^ (1 / d)
  cpar$heta <- 1e10
  if (lkern == 5) {
    #  assume  hmax was given in  FWHM  units (Gaussian kernel will be truncated at 4)
    hmax <- hmax * 0.42445 * 4
  }
  # now check which procedure is appropriate
  ##  this is the version on a grid
  n1 <- nbins[1]
  n2 <- switch(d, 1, nbins[2])
  dy <- switch(d, NULL, c(n1, n2))
  #
  #    Initialize  for the iteration
  #
  tobj <- list(
    bi = ni,
    bi2 = ni ^ 2,
    theta = yy / shape,
    fix = rep(0, nn)
  )
  zobj <- list(ai = yy, bi0 = rep(1, nn))
  vred <- ni
  lambda0 <-
    1e50 # that removes the stochstic term for the first step, initialization by kernel estimates
  #
  #   produce a presmoothed estimate to stabilze variance estimates
  #
  if (is.null(hpre))
    hpre <- (20 * nn / n) ^ (1 / d)
  dlw <- (2 * trunc(hpre / c(1, wghts)) + 1)[1:d]
  hobj <- .Fortran(C_cawsmask,
    as.double(yy),
    as.integer(ni > 0),
    # bins where we need estimates
    as.integer(ni),
    # contains number of points in bin
    as.integer(tobj$fix),
    as.integer(n1),
    as.integer(n2),
    hakt = as.double(hpre),
    bi = as.double(tobj$bi),
    bi2 = double(nn),
    bi0 = as.double(zobj$bi0),
    ai = as.double(zobj$ai),
    as.integer(lkern),
    double(prod(dlw)),
    as.double(wghts)
  )[c("bi", "ai")]
  hobj$theta <- hobj$ai / hobj$bi
  hobj$theta[ni == 0] <- mean(hobj$theta[ni > 0])
  dim(hobj$theta) <- dim(hobj$bi) <- dy
  #
  #   iteratate until maximal bandwidth is reached
  #
  total <- cumsum(1.25 ^ (1:kstar)) / sum(1.25 ^ (1:kstar))
  cat("Progress:")
  while (k <= kstar) {
    hakt0 <-
      max(1.01, gethani(1, 10, lkern, 1.25 ^ (k - 1), wghts, 1e-4))
    hakt <- max(1.01, gethani(1, 10, lkern, 1.25 ^ k, wghts, 1e-4))
    cat("step", k, "hakt", hakt, "\n")
    if (lkern == 5) {
      #  assume  hmax was given in  FWHM  units (Gaussian kernel will be truncated at 4)
      hakt <- hakt * 0.42445 * 4
    }
    dlw <- (2 * trunc(hakt / c(1, wghts)) + 1)[1:d]
    # heteroskedastic Gaussian case
    zobj <- .Fortran(C_cgawsmas,
      as.double(yy),
      as.integer(mask),
      # bins where we need estimates
      as.integer(ni),
      # contains number of points in bin
      as.integer(tobj$fix),
      as.double(sigma2),
      as.integer(n1),
      as.integer(n2),
      hakt = as.double(hakt),
      as.double(lambda0),
      as.double(tobj$theta),
      bi = as.double(tobj$bi),
      bi2 = double(nn),
      bi0 = as.double(zobj$bi0),
      vred = double(nn),
      ai = as.double(zobj$ai),
      as.integer(cpar$mcode),
      as.integer(lkern),
      as.double(0.25),
      double(prod(dlw)),
      as.double(wghts)
    )[c("bi", "bi0", "bi2", "vred", "ai", "hakt")]
    vred[tobj$fix==0] <- zobj$vred[tobj$fix==0]
    dim(zobj$ai) <- dy
    if (hakt > n1 / 2)
      zobj$bi0 <- rep(max(zobj$bi), n1 * n2)
    tobj <- updtheta(zobj, tobj, cpar)
    tobj$vred <- vred
    tobj$theta[tobj$bi == 0] <- mean(tobj$theta[ni > 0])
    dim(tobj$vred) <- dy
    dim(tobj$theta) <- dy
    dim(tobj$bi) <- dy
    dim(tobj$eta) <- dy
    if (graph) {
      #
      #     Display intermediate results if graph == TRUE
      #
      if (d == 1) {
        xseq <- seq(xmin, xmax, length = nbins)
        oldpar <- par(
          mfrow = c(1, 2),
          mar = c(3, 3, 3, .2),
          mgp = c(2, 1, 0)
        )
        plot(
          xseq[ni > 0],
          yy[ni > 0],
          ylim = range(yy, tobj$theta[mask]),
          col = 3,
          xlab = "x",
          ylab = "y"
        )
        lines(xseq[mask], tobj$theta[mask], lwd = 2)
        title(paste("Reconstruction  h=", signif(hakt, 3)))
        plot(
          xseq,
          tobj$bi,
          type = "l",
          ylim = range(0, tobj$bi),
          xlab = "x",
          ylab = "bi/variance"
        )
        title("Sum of weights/variance")
      }
      if (d == 2) {
        oldpar <- par(
          mfrow = c(1, 3),
          mar = c(3, 3, 3, .25),
          mgp = c(2, 1, 0)
        )
        image(yy,
              col = grey((0:255) / 255),
              xaxt = "n",
              yaxt = "n")
        title(paste(
          "Observed Image  min=",
          signif(min(yy[mask]), 3),
          " max=",
          signif(max(yy[mask]), 3)
        ))
        zlim <- quantile(tobj$theta, c(0.001, 0.999))
        image(
          array(pmax(pmin(
            tobj$theta, zlim[2]
          ), zlim[1]), dy),
          col = grey((0:255) / 255),
          xaxt = "n",
          yaxt = "n"
        )
        title(paste(
          "Reconstruction  h=",
          signif(hakt, 3),
          " min=",
          signif(min(tobj$theta[mask]), 3),
          " max=",
          signif(max(tobj$theta[mask]), 3)
        ))
        image(
          tobj$bi,
          col = grey((0:255) / 255),
          xaxt = "n",
          yaxt = "n"
        )
        title(paste(
          "Sum of weights: min=",
          signif(min(tobj$bi[mask]), 3),
          " mean=",
          signif(mean(tobj$bi[mask]), 3),
          " max=",
          signif(max(tobj$bi), 3)
        ))
      }
      par(oldpar)
    }
    #
    #   Prepare for next iteration
    #
    #
    #   Create new variance estimate
    #
    if (!given.var) {
      vobj <- awsisigma2(yy, hobj, tobj, ni, sigma20, varmodel, varprop)
      sigma2 <- vobj$si2
      vcoef <- vobj$vcoef
    }
    lambda0 <- lambda
    if (max(total) > 0) {
      cat(signif(total[k], 2) * 100, "% . ", sep = "")
    }
    k <- k + 1
    gc()
  }
  cat("\n")
  ###
  ###            end iterations now prepare results
  ###
  ###   component var contains an estimate of Var(tobj$theta) if aggkern="Uniform", or if memory = TRUE
  ###
  if (length(sigma2) == nn) {
    # heteroskedastic case
    vartheta <- tobj$bi2 / tobj$bi ^ 2
  } else {
    # homoskedastic case
    vartheta <- sigma2 * tobj$bi2 / tobj$bi ^ 2
    vred <- tobj$bi2 / tobj$bi ^ 2
  }
  awsobj(
    yy,
    tobj$theta,
    vartheta,
    hakt,
    1 / sigma2,
    lkern,
    lambda,
    ladjust,
    aws,
    memory,
    args,
    ni = ni,
    homogen = FALSE,
    earlystop = FALSE,
    family = "Gaussian",
    wghts = wghts,
    varmodel = varmodel,
    vcoef = vcoef,
    x = cbind(zbins$midpoints.x1,zbins$midpoints.x2),
    xmin = xmin,
    xmax = xmax
  )

}
############################################################################
#
#  estimate inverse of variances
#
############################################################################
awsisigma2 <- function(y,
                       hobj,
                       tobj,
                       ni,
                       sigma20,
                       varmodel,
                       varprop) {
  if (is.null(dy <- dim(y)))
    dy <- length(y)
  vredinv <- 1 / tobj$vred
  vredinv[is.na(vredinv)] <- 0
  vredinv[vredinv > 1e10] <- 0
  ind <- vredinv > ni & ni > 0
  if(sum(ind)>0){
  residsq <-
    pmax(1, ni[ind] - 1) * ((y - tobj$theta)[ind] * vredinv[ind] / (vredinv[ind] -
                                                                      ni[ind])) ^ 2
  theta <- tobj$theta[ind]
  if (varmodel == "Quadratic")
    theta2 <- theta ^ 2
  wght <- (vredinv - ni)[ind]
  coef <- switch(
    varmodel,
    Constant = coefficients(lm(residsq ~ 1, weights = wght)),
    Linear = coefficients(lm(residsq ~ theta, weights = wght)),
    Quadratic = coefficients(lm(residsq ~ theta + theta2, weights =
                                  wght))
  )
  gamma <- pmin(vredinv / hobj$bi, 1)
  gamma[is.na(gamma)] <- 0
  theta <- gamma * tobj$theta + (1 - gamma) * hobj$theta
  #
  #    use smoother estimates to obtain more stable variance estimates
  #
  eta <-
    sum(vredinv[ind] / ni[ind] - 1) / (5 * sum(ni[ni > 0] - 1) + sum(vredinv[ind] /
                                                                       ni[ind] - 1))
  #cat("eta",sum(vredinv[ind]-1),sum(ni[ni>0]-1),eta,"\n")
  sigma2 <- switch(
    varmodel,
    Constant = array(coef, dy),
    Linear = coef[1] + coef[2] * theta,
    Quadratic = coef[1] + coef[2] * theta + coef[3] * theta ^ 2
  )
  varquantile <- quantile(residsq, varprop)
  sigma2 <- eta * pmax(sigma2, varquantile) + (1 - eta) * sigma20
} else {
   sigma2 <- sigma20
   coef <- c(sigma20,0,0)
}
  #cat("Estimated mean variance",signif(mean(sigma2[ni>0]),3)," Variance parameters:",signif(coef,3),"\n")
  list(si2 = 1 / sigma2, vcoef = coef)
}