R/helper_walk_fwd.R
In ess: Efficient Stepwise Selection in Decomposable Models

fwd_init <- function(x, df, q) {
  # x : fwd object
  M       <- nrow(df)
  penalty <- log(M)*q + (1 - q)*2
  nodes <- colnames(df)
  n     <- length(nodes)
  pairs <- utils::combn(nodes, 2,  simplify = FALSE)
  for (j in 1:n) {
    npc_j <- new.env()
    x$mem[["ent"]][[nodes[j]]] <- entropy(df[nodes[j]], npc = npc_j)
    x$mem[["npc"]][[nodes[j]]] <- npc_j[["value"]]
  }
  x$msi <- lapply(seq_along(pairs), function(p) {
    v <- pairs[[p]]
    edge_v      <- sort_(v)
    npc_edge_v  <- new.env()
    x$mem[["ent"]][[edge_v]] <<- entropy(df[v], npc = npc_edge_v)
    x$mem[["npc"]][[edge_v]] <- npc_edge_v[["value"]]
    ed       <- x$mem[["ent"]][[v[1]]] + x$mem[["ent"]][[v[2]]] - x$mem[["ent"]][[edge_v]]
    dev      <- 2 * M * ed
    d_parms  <- if (x$sparse_qic) npc_edge_v[["value"]] else prod(x$lvls[v] - 1)
    d_qic    <- dev - penalty * d_parms
    if (d_qic >= attr(x$e, "d_qic")) {
      x$e <<- new_edge(edge_v, d_qic, p)
    }
    list(C1 = v[1], C2 = v[2], S = character(0L), e = structure(ed, names = edge_v))
  })
  # If the null graph is the best, d_qic = 0 and x$e = character(0)
  if (neq_empt_chr(as.vector(x$e))) attr(x$e, "ins") <- match(es_to_vs(x$e)[[1]], x$adj_list_cg)
  return(x)
}

find_new_edge <- function(msi_prime, CG_prime) {
  max_es   <- sapply(msi_prime, function(z) z$e[which.max(z$e)])
  max_idx  <- which.max(max_es)
  max_e    <- names(max_idx)
  max_atom <- msi_prime[[max_idx]]
  max_ins  <- unlist(sapply(seq_along(CG_prime), function(x) {
    cond <- setequal(CG_prime[[x]], max_atom$C1) || setequal(CG_prime[[x]], max_atom$C2)
    if( cond ) return(x)
  }))
  new_edge(max_e, unname(max_es[max_idx]), max_idx, max_ins)
}

# Cx: clique (vector of characters) 
is_Cx <- function(msi, Cx) {
  .map_lgl(msi, function(x) setequal(x$C1, Cx) || setequal(x$C2, Cx))
} 

is_Ca_or_Cb <- function(msi, x, y) {
  .map_lgl(msi, function(z) {
    is_CaCb <- setequal(z$C1, x) || setequal(z$C2, y)
    is_CbCa <- setequal(z$C1, y) || setequal(z$C2, x)
    is_CaCb || is_CbCa
  })
}

is_Ca_and_Cb <- function(msi, x, y) {
  .map_lgl(msi, function(z) {
    is_CaCb <- setequal(z$C1, x) && setequal(z$C2, y)
    is_CbCa <- setequal(z$C1, y) && setequal(z$C2, x)
    is_CaCb || is_CbCa
  })
}

edges_to_delete <- function(prone_to_deletion, TVL, MSab, Cab, Sab, cta, ctb) {
  ## TVL  : Temporary vertex list
  ## MSab : logical indicating which prone_to_deletion (those with C1 \cap C2 = Sab) that has eab = (va, vb)
  etd <- .map_lgl(seq_along(MSab), function(k) {
    delete <- FALSE
    x <- prone_to_deletion[[k]]
    if (MSab[k]) {
      if (!all(x$C1 %in% Cab) && !all(x$C2 %in% Cab)) {
        delete <- TRUE
        TVL <- c(TVL, x$C1, x$C2)
      }
    }
    else {
      C1_minus_Sab <- setdiff(x$C1, Sab)
      C2_minus_Sab <- setdiff(x$C2, Sab)
      va_in_C1_Sab <- all(C1_minus_Sab %in% cta)
      va_in_C2_Sab <- all(C2_minus_Sab %in% cta)
      vb_in_C1_Sab <- all(C1_minus_Sab %in% ctb)
      vb_in_C2_Sab <- all(C2_minus_Sab %in% ctb)
      delete <- FALSE
      if ((va_in_C1_Sab && vb_in_C2_Sab) || (va_in_C2_Sab && vb_in_C1_Sab)) {
        delete <- TRUE
      }
    }
    delete
  })
  list(del = Filter(neq_null, prone_to_deletion[etd]), TVL = TVL)
}

which_Cp_from_Cx_to_Cab <- function(CG_prime, C_prime_Cx, Cx, vx, Cab, Sab,  cty, TVL) {
  add <- vector("numeric", 0L)
  for (k in C_prime_Cx) {
    Cp    <- CG_prime[[k]]
    Sp    <- intersect(Cp, Cx)
    Sn    <- intersect(Cp, Cab)
    Sab_x <- c(Sab, vx)
    if (neq_empt_chr(Sab)) {
      if (all(Sp %in% Sab_x)) {
        add <- c(add, k)
      }
      if (setequal(Sn, Sab_x) && !(any(setdiff(Cp, Sab_x) %in% cty))) {
        add <- c(add, k)
      }
    }
    else {
      if (vx %in% Sn || !neq_empt_chr(Sp)) {
        add <- c(add, k)
      }
    }
  }
  add_tvl <- which(CG_prime %in% TVL) # For all C' in TVL add (C', Cab) to CG_prime
  list(add = unique(add), add_tvl = unique(add_tvl)) 
}

update_edges_from_C_primes_to_Cab <- function(
                                              df,
                                              Cps,
                                              Cab,
                                              va,
                                              vb,
                                              mem,
                                              lvls,
                                              q,
                                              thres,
                                              sparse_qic
                                              ) {
  # Cps : C_primes
  M       <- nrow(df)
  penalty <- log(M)*q + (1 - q)*2
  sep <- lapply(Cps, function(Cp) {
    # browser()
    Sp          <- intersect(Cp, Cab)
    eligs_Cab   <- setdiff(Cab, Cp)
    eligs_Cp    <- setdiff(Cp, Cab)
    eligs       <- apply(expand.grid(eligs_Cp, eligs_Cab), 1, paste, collapse = "|")

    ent <- structure(vector("double", length = length(eligs)), names = eligs)
    npc <- structure(vector("integer", length = length(eligs)), names = eligs)

    # browser()
    
    for (k in seq_along(eligs)) {
      ek <- eligs[k]
      ed_k <- entropy_difference(ek, Sp, df, mem, thres)
      ent[k] <- ed_k[["ent"]]
      npc[k] <- ed_k[["npc"]]
    }
    
    dev <- 2 * M * ent

    d_parms <- if (sparse_qic) npc else {
      .map_dbl(es_to_vs(eligs), function(x) {
       prod(lvls[x] - 1) * prod(lvls[Sp])
     })
    }
    
    d_qic <- dev - penalty * d_parms
    list(C1 = Cp, C2 = Cab, S = Sp, e = d_qic)
  })
  return(list(msi = Filter(neq_null, sep) , mem = mem))
}