PO2PLS: Probabilistic Two-Way Orthogonal Partial Least Squares

Documented in blockm bootstrap_inner.po2m cov.PO2PLS E_step E_step_slow E_step_test generate_data generate_params jitter_params Lemma M_step PO2PLS variances_inner.po2m

#' PO2PLS: Probabilistic Two-way Orthogonal Partial Least Squares
#'
#' This package implements the probabilistic O2PLS method.
#'
#' @author
#' Said el Bouhaddani,
#' Jeanine Houwing-Duistermaat,
#' Geurt Jongbloed,
#' Hae-Won Uh.
#'
#' Maintainer: Said el Bouhaddani (\email{s.el_bouhaddani@@outlook.com}).
#'
#' @name PO2PLS-package
#' @keywords Probabilistic-O2PLS
#' @import OmicsPLS Rcpp RcppArmadillo magrittr dplyr tibble parallel
#' @importFrom Rcpp evalCpp
#' @importFrom utils tail
#' @importFrom stats pchisq rnorm runif sd
#' @importFrom MASS ginv
#' @useDynLib PO2PLS, .registration=TRUE
"_PACKAGE"

#' Construct a block-diagonal matrix
#'
#' @param A Numerical matrix. Upper diagonal block.
#' @param B Numerical matrix. Off diagonal block.
#' @param C Numerical matrix. Lower diagonal block
#'
#' @return A block diagonal matrix of the form \eqn{\begin{bmatrix} A & B \\ B' & C \end{bmatrix}}.
#'
#' @details This function is typically called for constructing the covariance matrix of $(x,y)$.
#'
#' @export
blockm<-function(A,B,C)
  #input: Matrices A,B,C
  #output: the block matrix
  # A    B
  #t(B)  C
{
  M = rbind(cbind(A,B),cbind(t(B),C))
  return(M)
}


#' Generate parameter values of a PO2PLS model
#'
#' @param X Numerical data matrix or positive integer. This parameter should either be a dataset \eqn{X} or the number of desired \eqn{X} variables.
#' @param Y Numerical data matrix or positive integer. This parameter should either be a dataset \eqn{Y} or the number of desired \eqn{Y} variables.
#' @param alpha Numeric vector. The length should be either one or three, with each entry between 0 and 1. It represents the proportion of noise relative to the variation of \eqn{X}, \eqn{Y}, and \eqn{U}, respectively. If only one number is given, it is used for all three parts.
#' @param type Character. Should be one of "random", "o2m" or "unit". Specifies which kind of parameters should be generated. If "o2m" is chosen, \code{X} and \code{Y} should be data matrices.
#'
#' @return A list with
#' \describe{
#' \item{W}{\eqn{X} joint loadings}
#' \item{Wo}{\eqn{X} specific loadings}
#' \item{C}{\eqn{Y} joint loadings}
#' \item{Co}{\eqn{Y} specific loadings}
#' \item{B}{Regression matrix of \eqn{U} on \eqn{T}}
#' \item{SigT}{Covariance matrix of \eqn{T}}
#' \item{SigTo}{Covariance matrix of \eqn{To}}
#' \item{SigUo}{Covariance matrix of \eqn{Uo}}
#' \item{SigH}{Covariance matrix of \eqn{H}}
#' \item{sig2E}{Variance of \eqn{E}}
#' \item{sig2F}{Variance of \eqn{F}}
#' }
#'
#' @details A list of PO2PLS parameters are generated based on the value of \code{type}:
#' \describe{
#' \item{\code{type="random"}}{Variance parameters are randomly sampled from a uniform distribution on 1 and 3 (1 and 4 for \eqn{B}).}
#' \item{\code{type="o2m"}}{O2PLS is fitted to \code{X} and \code{Y} first using \code{\link{o2m}} from the OmicsPLS package, and the corresponding PO2PLS parameters are derived from the result.}
#' \item{\code{type="unit"}}{The diagonal of each covariance matrix is a decreasing sequence from the number of components to one.}
#' }
#'
#' @inheritParams PO2PLS
#'
#' @export
generate_params <- function(X, Y, r, rx, ry, alpha = 0.1, type=c('random','o2m','unit')){
  type=match.arg(type)
  p = ifelse(is.matrix(X), ncol(X), X)
  q = ifelse(is.matrix(Y), ncol(Y), Y)
  if(type=="o2m"){
    return(with(o2m(X, Y, r, rx, ry, stripped=TRUE),{
      list(
        W = W.,
        Wo = suppressWarnings(orth(P_Yosc.)),
        C = C.,
        Co = suppressWarnings(orth(P_Xosc.)),
        B = abs(cov(Tt,U)%*%MASS::ginv(cov(Tt)))*diag(1,r),
        SigT = cov(Tt)*diag(1,r),
        SigTo = sign(rx)*cov(T_Yosc)*diag(1,max(1,rx)),
        SigUo = sign(ry)*cov(U_Xosc)*diag(1,max(1,ry)),
        SigH = cov(H_UT)*diag(1,r),
        sig2E = (ssq(X)-ssq(Tt)-ssq(T_Yosc))/prod(dim(X)) + 0.01,
        sig2F = (ssq(Y)-ssq(U)-ssq(U_Xosc))/prod(dim(Y)) + 0.01
      )}))
  }
  if(type=="random"){
    if(length(alpha) == 1) alpha <- rep(alpha, 3)
    if(!(length(alpha) %in% c(1,3))) stop("length alpha should be 1 or 3")

    outp <- list(
      W = orth(matrix(rnorm(p*r), p, r)+1),
      Wo = suppressWarnings(sign(rx)*orth(matrix(rnorm(p*max(1,rx)), p, max(1,rx))+seq(-p/2,p/2,length.out = p))),
      C = orth(matrix(rnorm(q*r), q, r)+1),
      Co = suppressWarnings(sign(ry)*orth(matrix(rnorm(q*max(1,rx)), q, max(1,ry))+seq(-q/2,q/2,length.out = q))),
      B = diag(sort(runif(r,1,4),decreasing = TRUE),r),
      SigT = diag(sort(runif(r,1,3),decreasing = TRUE),r),
      SigTo = sign(rx)*diag(sort(runif(max(1,rx),1,3),decreasing = TRUE),max(1,rx)),
      SigUo = sign(ry)*diag(sort(runif(max(1,ry),1,3),decreasing = TRUE),max(1,ry))
    )
    outp$SigH = diag(alpha[3]/(1-alpha[3])*(mean(diag(outp$SigT%*%outp$B))),r) #cov(H_UT)*diag(1,r),
    return(with(outp, {
      c(outp,
        sig2E = alpha[1]/(1-alpha[1])*(mean(diag(SigT)) + mean(diag(SigTo)))/p,
        sig2F = alpha[2]/(1-alpha[2])*(mean(diag(SigT%*%B^2 + SigH)) + mean(diag(SigUo)))/q)
    }))
  }
  if(type=="unit"){
    if(length(alpha) == 1) alpha <- rep(alpha, 3)
    if(!(length(alpha) %in% c(1,3))) stop("length alpha should be 1 or 3")

    outp <- list(
      W = orth(matrix(rnorm(p*r), p, r)+1),
      Wo = suppressWarnings(sign(rx)*orth(matrix(rnorm(p*max(1,rx)), p, max(1,rx))+seq(-p/2,p/2,length.out = p))),
      C = orth(matrix(rnorm(q*r), q, r)+1),
      Co = suppressWarnings(sign(ry)*orth(matrix(rnorm(q*max(1,rx)), q, max(1,ry))+seq(-q/2,q/2,length.out = q))),
      B = diag(r:1,r),
      SigT = diag(r:1,r),
      SigTo = sign(rx)*diag(max(1,rx):1,max(1,rx)),
      SigUo = sign(ry)*diag(max(1,ry):1,max(1,ry))
    )
    outp$SigH = diag(alpha[3]/(1-alpha[3])*(mean(diag(outp$SigT%*%outp$B))),r) #cov(H_UT)*diag(1,r),
    with(outp, {
      c(outp,
        sig2E = alpha[1]/(1-alpha[1])*(mean(diag(SigT)) + mean(diag(SigTo)))/p,
        sig2F = alpha[2]/(1-alpha[2])*(mean(diag(SigT%*%B^2 + SigH)) + mean(diag(SigUo)))/q)
    })
  }
}

#' Generate two datasets based on PO2PLS
#'
#' @param N Positive integer. Sample size to be simulated
#' @param params A list as generated by \code{\link{generate_params}}
#' @param distr Function. One of the random number generator functions (e.g. rnorm) for generating latent variables
#'
#' @return A list containing the X and Y matrix
#'
#' @export
generate_data <- function(N, params, distr = rnorm){
  W = params$W
  C = params$C
  Wo = params$Wo
  Co = params$Co
  B = params$B
  SigT = params$SigT
  SigTo = params$SigTo + 1e-6*SigT[1]*(params$SigTo[1]==0)
  SigH = params$SigH
  sig2E = params$sig2E
  sig2F = params$sig2F
  SigU = SigT%*%B^2 + SigH
  SigUo = params$SigUo + 1e-6*SigU[1]*(params$SigUo[1]==0)

  p = nrow(W)
  q = nrow(C)
  r = ncol(W)
  rx = ncol(Wo)
  ry = ncol(Co)

  Gamma = rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry)),
                cbind(matrix(0,q,r), C, matrix(0,q,rx), Co))
  VarZ = blockm(
    blockm(
      blockm(SigT, SigT%*%B, SigU),
      matrix(0,2*r,rx), SigTo),
    matrix(0,2*r+rx,ry), SigUo)

  # MASS::mvrnorm(n = N,
  #               mu = rep(0,p+q),
  #               Sigma = Gamma %*% VarZ %*% t(Gamma) +
  #                 diag(rep(c(sig2E,sig2F),c(p,q))))

  Z <- scale(matrix(distr(N*(2*r+rx+ry)), N))
  Z <- Z %*% chol(VarZ)
  Z[,2*r+1:rx] <- sign(ssq(Wo))*Z[,2*r+1:rx]
  Z[,2*r+rx+1:ry] <- sign(ssq(Co))*Z[,2*r+rx+1:ry]

  EF <- cbind(scale(matrix(distr(N*p), N))*sqrt(sig2E), scale(matrix(distr(N*q), N))*sqrt(sig2F))

  dat <- Z %*% t(Gamma) + EF
  return(list(X = dat[,1:p], Y = dat[,-(1:p)]))

}

#' Implements block-wise inverse
#'
#' Internal use only
#'
#' @param X Concatenated data matrix
#' @param SigmaZ Variance of Z
#' @param invZtilde Inverse of Z_tilde
#' @param Gamma Gamma
#' @param sig2E Variance of E
#' @param sig2F Variance of F
#' @param p X dimensions
#' @param q Y dimensions
#' @inheritParams PO2PLS
#'
#' @keywords internal
#' @export
Lemma <- function(X, SigmaZ, invZtilde, Gamma, sig2E, sig2F, p, q, r, rx, ry){
  GammaEF <- Gamma
  GammaEF[1:p,c(1:r,2*r+1:rx)] <- 1/sig2E* GammaEF[1:p,c(1:r,2*r+1:rx)]
  GammaEF[-(1:p),c(r+1:r,2*r+rx+1:ry)] <- 1/sig2F* GammaEF[-(1:p),c(r+1:r,2*r+rx+1:ry)]

  #invSEF <- diag(1/diag(SigmaEF))
  #invS <- invSEF - invSEF %*% Gamma %*% MASS::ginv(MASS::ginv(SigmaZ) + t(Gamma)%*%invSEF%*%Gamma) %*% t(Gamma) %*% invSEF
  GGef <- t(Gamma) %*% GammaEF
  VarZc <- SigmaZ - (t(Gamma %*% SigmaZ) %*% GammaEF) %*% SigmaZ +
    (t(Gamma %*% SigmaZ) %*% GammaEF) %*% invZtilde %*% GGef %*% SigmaZ

  EZc <- X %*% (GammaEF %*% SigmaZ)
  EZc <- EZc - X %*% ((GammaEF %*% invZtilde)  %*% (GGef %*% SigmaZ))
  # MASS::ginv(t(0))
  return(list(EZc = EZc, VarZc = VarZc))
}

#' Expectation step (slower version)
#'
#' Internal function only
#'
#' @param X Data matrix
#' @param Y Data matrix
#' @param params List with parameters
#' @keywords internal
#'
#' @export
E_step_slow <- function(X, Y, params){
  ## retrieve parameters
  W = params$W
  C = params$C
  Wo = params$Wo
  Co = params$Co
  B = params$B
  SigT = params$SigT
  SigTo = (ssq(Wo)>0)*params$SigTo +0# + 1e-10*(ssq(Wo)==0)
  SigUo = (ssq(Co)>0)*params$SigUo +0# + 1e-10*(ssq(Co)==0)
  SigH = params$SigH
  sig2E = params$sig2E
  sig2F = params$sig2F
  SigU = SigT%*%B^2 + SigH

  ## define dimensions
  N = nrow(X)
  p = nrow(W)
  q = nrow(C)
  r = ncol(W)
  rx = ncol(Wo)
  ry = ncol(Co)

  ## concatenate data
  dataXY <- cbind(X,Y)

  ## Gamma is the generalized loading matrix, with PO2PLS structure
  Gamma = rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry)),
                cbind(matrix(0,q,r), C, matrix(0,q,rx), Co))
  ## Gamma multiplied by inverse SigmaEF
  GammaEF <- Gamma
  GammaEF[1:p,c(1:r,2*r+1:rx)] <- 1/sig2E* GammaEF[1:p,c(1:r,2*r+1:rx)]
  GammaEF[-(1:p),c(r+1:r,2*r+rx+1:ry)] <- 1/sig2F* GammaEF[-(1:p),c(r+1:r,2*r+rx+1:ry)]
  GGef <- t(Gamma) %*% GammaEF

  ## diagonal cov matrix of (E,F), hopefully NOT NEEDED
  # SigmaEF = diag(rep(c(sig2E,sig2F),c(p,q)))
  ## ALMOST diagonal cov matrix of (T,U,To,Uo)
  SigmaZ = blockm(
    blockm(
      blockm(SigT, SigT%*%B, SigU),
      matrix(0,2*r,rx), SigTo),
    matrix(0,2*r+rx,ry), SigUo)

  ## inverse middle term lemma
  invZtilde <- MASS::ginv(MASS::ginv(SigmaZ) + GGef)

  ## Calculate conditional expectations with efficient lemma
  # print(all.equal(invS,invS_old))
  tmp <- Lemma(dataXY, SigmaZ, invZtilde, Gamma, sig2E, sig2F,p,q,r,rx,ry)
  # print(all.equal(Lemma(cbind(X,Y), SigmaZ, invS, Gamma, sig2E, sig2F,p,q,r,rx,ry), Lemma_old(cbind(X,Y), SigmaZ, invS, Gamma)))

  ## Define Szz as expected crossprod of Z
  VarZc = tmp$VarZc
  EZc = tmp$EZc
  Szz = VarZc + crossprod(EZc)/N

  ## For compatibility
  # invEF_Gamma <- rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry))/sig2E,
  #                      cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)/sig2F)
  # inv2EF_Gamma <- rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry))/(sig2E^2),
  #                       cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)/(sig2F^2))
  # invZtilde <- MASS::ginv(MASS::ginv(SigmaZ) +
  #                      t(Gamma) %*% rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry))/sig2E,
  #                                         cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)/sig2F))
  #
  # invS_Gamma <- invEF_Gamma - invEF_Gamma %*% invZtilde %*% crossprod(invEF_Gamma,Gamma)

  ## inverse in middle term in lemma
  # invZtilde <- MASS::ginv(MASS::ginv(SigmaZ) +
  #                      t(Gamma) %*% rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry))/sig2E,
  #                                         cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)/sig2F))

  ## Calculate cond mean of E,F
  # invS_covEF <- diag(1,p+q) - invEF_Gamma %*% invZtilde %*% t(Gamma)
  # covEF = rbind(diag(sig2E,p), diag(0,q,p))
  # mu_EF_old = dataXY - dataXY %*% invEF_Gamma %*% invZtilde %*% t(Gamma)
  mu_EF = dataXY
  mu_EF <- mu_EF - (dataXY %*% (GammaEF %*% invZtilde)) %*% t(Gamma)

  ## Calculate immediately expected crossprod of E,F
  # Ceeff_old = SigmaEF - t(SigmaEF) %*% invS_covEF + crossprod(mu_EF) / N
  # Ceeff = Gamma %*% MASS::ginv(MASS::ginv(SigmaZ) + t(Gamma)%*%invSEF%*%Gamma) %*% t(Gamma) +
  #   crossprod(mu_EF) / N
  # print(all.equal(mu_EF_old, mu_EF))
  # print(all.equal(Ceeff_old, Ceeff))

  ## Take trace of the matrix
  # Cee_old <- sum(diag(Ceeff_old[1:p,1:p]))/p
  Cee <- sum(diag(
    crossprod(rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry)),
                    cbind(matrix(0,q,r), 0*C, matrix(0,q,rx), 0*Co)))%*%invZtilde
  ))/p + ssq(mu_EF[,1:p])/N/p
  # Cff_old <- sum(diag(Ceeff_old[-(1:p),-(1:p)]))/q
  Cff <- sum(diag(
    crossprod(rbind(cbind(0*W, matrix(0,p,r), 0*Wo, matrix(0,p,ry)),
                    cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)))%*%invZtilde
  ))/q + ssq(mu_EF[,-(1:p)])/N/q
  # cat('Cee\n'); print(all.equal(Cee_old,Cee));
  # print(all.equal(Cff_old,Cff))

  # Cee <- sum(diag(
  #   crossprod(rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry)),
  #                   cbind(matrix(0,q,r), 0*C, matrix(0,q,rx), 0*Co)))%*%invZtilde
  # ))/p + ssq(mu_EF[,1:p])/N/p
  # Cff <- sum(diag(
  #   crossprod(rbind(cbind(0*W, matrix(0,p,r), 0*Wo, matrix(0,p,ry)),
  #                   cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)))%*%invZtilde
  # ))/q + ssq(mu_EF[,-(1:p)])/N/q


  #covE = rbind(diag(sig2E,p), diag(0,q,p))
  #mu_E = cbind(X,Y) %*% invS %*% covE
  #Cee = sum(diag(diag(sig2E,p) - t(covE) %*% invS %*% covE + crossprod(mu_E) / N))/p

  #covF = rbind(diag(0,p,q), diag(sig2F,q))
  #mu_F = cbind(X,Y) %*% invS %*% covF
  #Cff = sum(diag(diag(sig2F,q) - t(covF) %*% invS %*% covF + crossprod(mu_F) / N))/q

  covH = rbind(0*W, C%*%SigH)
  covHEF = rbind(0*W, C%*%SigH/sig2F)
  # invS_covH <- (covH/sig2F - invEF_Gamma %*% invZtilde %*% crossprod(invEF_Gamma,covH))
  # mu_H_old = dataXY %*% invS_covH
  # mu_H_old <- dataXY %*% invS %*% covH
  mu_H <- dataXY %*% covHEF
  mu_H <- mu_H - (dataXY %*% (GammaEF %*% invZtilde)) %*% (t(Gamma) %*% covHEF)
  # Chh_old = SigH - t(covH) %*% invS_covH + crossprod(mu_H) / N
  # Chh_old <- SigH - t(covH) %*% invS %*% covH + crossprod(mu_H) / N
  Chh <- SigH
  Chh <- Chh - t(covH) %*% covHEF
  Chh <- Chh + (t(covH) %*% GammaEF %*% invZtilde) %*% (t(Gamma) %*% covHEF)
  Chh <- Chh + crossprod(mu_H) / N
  # print(all.equal(mu_H_old, mu_H))
  # print(all.equal(Chh_old, Chh))

  ## diagonal cov matrix of (X,Y), hopefully NOT NEEDED
  # SigmaXY = Gamma %*% SigmaZ %*% t(Gamma) + SigmaEF
  ## INVERSE diagonal cov matrix of (E,F), hopefully NOT NEEDED
  # invSEF <- diag(1/diag(SigmaEF))
  ## INVERSE diagonal cov matrix of (X,Y), hopefully NOT NEEDED
  # invS <- invSEF - invSEF %*% Gamma %*% MASS::ginv(MASS::ginv(SigmaZ) + t(Gamma)%*%invSEF%*%Gamma) %*% t(Gamma) %*% invSEF
  # if(use_lemma == TRUE){MASS::ginv(t(0))}
  ## log of det SigmaXY, see matrix determinant lemma
  logdet <- log(det(diag(2*r+rx+ry) + GGef%*%SigmaZ))+p*log(sig2E)+q*log(sig2F)
  ## representation of SigmaXY %*% invS
  XYinvS <- ssq(cbind(X/sqrt(sig2E), Y/sqrt(sig2F)))
  XYinvS <- XYinvS - sum(diag(crossprod(dataXY %*% GammaEF) %*% invZtilde))
  ## Log likelihood
  loglik = N*(p+q)*log(2*pi) + N * logdet + XYinvS
  loglik = - loglik/2
  # print(all.equal(XYinvS, sum(diag(dataXY %*% invS %*% t(dataXY)))))
  # MASS::ginv(t(0))

  comp_log <- - N/2*(p+q)*log(2*pi)
  comp_log <- comp_log - N/2*(p*log(sig2E)+q*log(sig2F))
  comp_log <- comp_log - N/2*ssq(cbind(X/sqrt(sig2E), Y/sqrt(sig2F)))
  comp_log <- comp_log + N*sum(diag(crossprod(EZc,dataXY)%*%GammaEF))
  comp_log <- comp_log - N/2*sum(diag(GGef%*%Szz))

  list(
    EZc = EZc,
    Szz = Szz,
    mu_T = matrix(EZc[,1:r],N,r),
    mu_U = matrix(EZc[,r+1:r],N,r),
    mu_To = matrix(EZc[,2*r+1:rx],N,rx),
    mu_Uo = matrix(EZc[,2*r+rx+1:ry],N,ry),
    Stt = matrix(Szz[1:r, 1:r],r,r),
    Suu = matrix(Szz[r+1:r, r+1:r],r,r),
    Stoto = matrix(Szz[2*r+1:rx, 2*r+1:rx],rx,rx),
    Suouo = matrix(Szz[2*r+rx+1:ry, 2*r+rx+1:ry],ry,ry),
    Sut = matrix(Szz[r+1:r, 1:r],r,r),
    Stto = matrix(Szz[1:r, 2*r+1:rx],r,rx),
    Suuo = matrix(Szz[r+1:r, 2*r+rx+1:ry],r,ry),
    See = Cee,
    Sff = Cff,
    Shh = Chh,
    loglik = loglik,
    comp_log = comp_log
  )

}

#' Expectation step
#'
#' Internal function only
#'
#' @param X Data matrix
#' @param Y Data matrix
#' @param params List with parameters
#'
#' @keywords internal
#' @export
E_step <- function(X, Y, params){
  ## retrieve parameters
  W = params$W
  C = params$C
  Wo = params$Wo
  Co = params$Co
  B = params$B
  SigT = params$SigT
  SigTo = (ssq(Wo)>0)*params$SigTo +0# + 1e-10*(ssq(Wo)==0)
  SigUo = (ssq(Co)>0)*params$SigUo +0# + 1e-10*(ssq(Co)==0)
  SigH = params$SigH
  sig2E = params$sig2E
  sig2F = params$sig2F
  SigU = SigT%*%B^2 + SigH

  ## define dimensions
  N = nrow(X)
  p = nrow(W)
  q = nrow(C)
  r = ncol(W)
  rx = ncol(Wo)
  ry = ncol(Co)

  ## concatenate data
  dataXY <- cbind(X,Y)

  ## Gamma is the generalized loading matrix, with PO2PLS structure
  Gamma = rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry)),
                cbind(matrix(0,q,r), C, matrix(0,q,rx), Co))
  ## Gamma multiplied by inverse SigmaEF
  GammaEF <- Gamma
  GammaEF[1:p,c(1:r,2*r+1:rx)] <- 1/sig2E* GammaEF[1:p,c(1:r,2*r+1:rx)]
  GammaEF[-(1:p),c(r+1:r,2*r+rx+1:ry)] <- 1/sig2F* GammaEF[-(1:p),c(r+1:r,2*r+rx+1:ry)]
  GGef <- t(Gamma) %*% GammaEF

  ## diagonal cov matrix of (E,F), hopefully NOT NEEDED
  # SigmaEF = diag(rep(c(sig2E,sig2F),c(p,q)))
  ## ALMOST diagonal cov matrix of (T,U,To,Uo)
  SigmaZ = blockm(
    blockm(
      blockm(SigT, SigT%*%B, SigU),
      matrix(0,2*r,rx), SigTo),
    matrix(0,2*r+rx,ry), SigUo)

  ## inverse middle term lemma
  invZtilde <- MASS::ginv(MASS::ginv(SigmaZ) + GGef)

  ## Calculate conditional expectations with efficient lemma
  # print(all.equal(invS,invS_old))
  tmp <- Lemma(dataXY, SigmaZ, invZtilde, Gamma, sig2E, sig2F,p,q,r,rx,ry)
  # print(all.equal(Lemma(cbind(X,Y), SigmaZ, invS, Gamma, sig2E, sig2F,p,q,r,rx,ry), Lemma_old(cbind(X,Y), SigmaZ, invS, Gamma)))

  ## Define Szz as expected crossprod of Z
  VarZc = tmp$VarZc
  EZc = tmp$EZc
  Szz = VarZc + crossprod(EZc)/N

  ## For compatibility
  # invEF_Gamma <- rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry))/sig2E,
  #                      cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)/sig2F)
  # inv2EF_Gamma <- rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry))/(sig2E^2),
  #                       cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)/(sig2F^2))
  # invZtilde <- MASS::ginv(MASS::ginv(SigmaZ) +
  #                      t(Gamma) %*% rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry))/sig2E,
  #                                         cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)/sig2F))
  #
  # invS_Gamma <- invEF_Gamma - invEF_Gamma %*% invZtilde %*% crossprod(invEF_Gamma,Gamma)

  ## inverse in middle term in lemma
  # invZtilde <- MASS::ginv(MASS::ginv(SigmaZ) +
  #                      t(Gamma) %*% rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry))/sig2E,
  #                                         cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)/sig2F))

  # ## Calculate cond mean of E,F
  # # invS_covEF <- diag(1,p+q) - invEF_Gamma %*% invZtilde %*% t(Gamma)
  # # covEF = rbind(diag(sig2E,p), diag(0,q,p))
  # # mu_EF_old = dataXY - dataXY %*% invEF_Gamma %*% invZtilde %*% t(Gamma)
  # mu_EF = dataXY
  # mu_EF <- mu_EF - (dataXY %*% (GammaEF %*% invZtilde)) %*% t(Gamma)
  #
  # ## Calculate immediately expected crossprod of E,F
  # # Ceeff_old = SigmaEF - t(SigmaEF) %*% invS_covEF + crossprod(mu_EF) / N
  # # Ceeff = Gamma %*% MASS::ginv(MASS::ginv(SigmaZ) + t(Gamma)%*%invSEF%*%Gamma) %*% t(Gamma) +
  # #   crossprod(mu_EF) / N
  # # print(all.equal(mu_EF_old, mu_EF))
  # # print(all.equal(Ceeff_old, Ceeff))
  #
  # ## Take trace of the matrix
  # # Cee_old <- sum(diag(Ceeff_old[1:p,1:p]))/p
  # Cee <- sum(diag(
  #   crossprod(rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry)),
  #                   cbind(matrix(0,q,r), 0*C, matrix(0,q,rx), 0*Co)))%*%invZtilde
  # ))/p + ssq(mu_EF[,1:p])/N/p
  # # Cff_old <- sum(diag(Ceeff_old[-(1:p),-(1:p)]))/q
  # Cff <- sum(diag(
  #   crossprod(rbind(cbind(0*W, matrix(0,p,r), 0*Wo, matrix(0,p,ry)),
  #                   cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)))%*%invZtilde
  # ))/q + ssq(mu_EF[,-(1:p)])/N/q
  # # cat('Cee\n'); print(all.equal(Cee_old,Cee));
  # # print(all.equal(Cff_old,Cff))
  #
  # # Cee <- sum(diag(
  # #   crossprod(rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry)),
  # #                   cbind(matrix(0,q,r), 0*C, matrix(0,q,rx), 0*Co)))%*%invZtilde
  # # ))/p + ssq(mu_EF[,1:p])/N/p
  # # Cff <- sum(diag(
  # #   crossprod(rbind(cbind(0*W, matrix(0,p,r), 0*Wo, matrix(0,p,ry)),
  # #                   cbind(matrix(0,q,r), C, matrix(0,q,rx), Co)))%*%invZtilde
  # # ))/q + ssq(mu_EF[,-(1:p)])/N/q
  #
  #
  # #covE = rbind(diag(sig2E,p), diag(0,q,p))
  # #mu_E = cbind(X,Y) %*% invS %*% covE
  # #Cee = sum(diag(diag(sig2E,p) - t(covE) %*% invS %*% covE + crossprod(mu_E) / N))/p
  #
  # #covF = rbind(diag(0,p,q), diag(sig2F,q))
  # #mu_F = cbind(X,Y) %*% invS %*% covF
  # #Cff = sum(diag(diag(sig2F,q) - t(covF) %*% invS %*% covF + crossprod(mu_F) / N))/q
  #
  # covH = rbind(0*W, C%*%SigH)
  # covHEF = rbind(0*W, C%*%SigH/sig2F)
  # # invS_covH <- (covH/sig2F - invEF_Gamma %*% invZtilde %*% crossprod(invEF_Gamma,covH))
  # # mu_H_old = dataXY %*% invS_covH
  # # mu_H_old <- dataXY %*% invS %*% covH
  # mu_H <- dataXY %*% covHEF
  # mu_H <- mu_H - (dataXY %*% (GammaEF %*% invZtilde)) %*% (t(Gamma) %*% covHEF)
  # # Chh_old = SigH - t(covH) %*% invS_covH + crossprod(mu_H) / N
  # # Chh_old <- SigH - t(covH) %*% invS %*% covH + crossprod(mu_H) / N
  # Chh <- SigH
  # Chh <- Chh - t(covH) %*% covHEF
  # Chh <- Chh + (t(covH) %*% GammaEF %*% invZtilde) %*% (t(Gamma) %*% covHEF)
  # Chh <- Chh + crossprod(mu_H) / N
  # # print(all.equal(mu_H_old, mu_H))
  # # print(all.equal(Chh_old, Chh))
  #
  # ## diagonal cov matrix of (X,Y), hopefully NOT NEEDED
  # # SigmaXY = Gamma %*% SigmaZ %*% t(Gamma) + SigmaEF
  # ## INVERSE diagonal cov matrix of (E,F), hopefully NOT NEEDED
  # # invSEF <- diag(1/diag(SigmaEF))
  # ## INVERSE diagonal cov matrix of (X,Y), hopefully NOT NEEDED
  # # invS <- invSEF - invSEF %*% Gamma %*% MASS::ginv(MASS::ginv(SigmaZ) + t(Gamma)%*%invSEF%*%Gamma) %*% t(Gamma) %*% invSEF
  # # if(use_lemma == TRUE){MASS::ginv(t(0))}
  # ## log of det SigmaXY, see matrix determinant lemma
  # logdet <- log(det(diag(2*r+rx+ry) + GGef%*%SigmaZ))+p*log(sig2E)+q*log(sig2F)
  # ## representation of SigmaXY %*% invS
  # XYinvS <- ssq(cbind(X/sqrt(sig2E), Y/sqrt(sig2F)))
  # XYinvS <- XYinvS - sum(diag(crossprod(dataXY %*% GammaEF) %*% invZtilde))
  # ## Log likelihood
  # loglik = N*(p+q)*log(2*pi) + N * logdet + XYinvS
  # loglik = - loglik/2
  # # print(all.equal(XYinvS, sum(diag(dataXY %*% invS %*% t(dataXY)))))
  # # MASS::ginv(t(0))
  #
  # comp_log <- - N/2*(p+q)*log(2*pi)
  # comp_log <- comp_log - N/2*(p*log(sig2E)+q*log(sig2F))
  # comp_log <- comp_log - N/2*ssq(cbind(X/sqrt(sig2E), Y/sqrt(sig2F)))
  # comp_log <- comp_log + N*sum(diag(crossprod(EZc,dataXY)%*%GammaEF))
  # comp_log <- comp_log - N/2*sum(diag(GGef%*%Szz))
  #
  # list(
  #   EZc = EZc,
  #   Szz = Szz,
  #   mu_T = matrix(EZc[,1:r],N,r),
  #   mu_U = matrix(EZc[,r+1:r],N,r),
  #   mu_To = matrix(EZc[,2*r+1:rx],N,rx),
  #   mu_Uo = matrix(EZc[,2*r+rx+1:ry],N,ry),
  #   Stt = matrix(Szz[1:r, 1:r],r,r),
  #   Suu = matrix(Szz[r+1:r, r+1:r],r,r),
  #   Stoto = matrix(Szz[2*r+1:rx, 2*r+1:rx],rx,rx),
  #   Suouo = matrix(Szz[2*r+rx+1:ry, 2*r+rx+1:ry],ry,ry),
  #   Sut = matrix(Szz[r+1:r, 1:r],r,r),
  #   Stto = matrix(Szz[1:r, 2*r+1:rx],r,rx),
  #   Suuo = matrix(Szz[r+1:r, 2*r+rx+1:ry],r,ry),
  #   See = Cee,
  #   Sff = Cff,
  #   Shh = Chh,
  #   loglik = loglik,
  #   comp_log = comp_log
  # )
  return(E_step_test(dataXY, p, q, r, rx, ry, N,
                     SigmaZ, GammaEF, invZtilde, Gamma, GGef, EZc, Szz,
                     W, C, Wo, Co, SigT, SigH, sig2E, sig2F))
}

#' @inherit E_step
#' @keywords internal
#' @export
E_step_test <- function(dataXY, p, q, r, rx, ry, N,
                        SigmaZ, GammaEF, invZtilde, Gamma, GGef, EZc, Szz,
                        W, C, Wo, Co, SigT, SigH, sig2E, sig2F){

  return(E_step_testC(dataXY, p, q, r, rx, ry, N,
                      SigmaZ, GammaEF, invZtilde, Gamma, GGef, EZc, Szz,
                      W, C, Wo, Co, SigT, SigH, sig2E, sig2F))

}

#' Maximization step
#'
#' Internal use only
#'
#' @inheritParams E_step
#' @inheritParams PO2PLS
#' @param E_fit An object returned by E_step
#'
#' @keywords internal
#' @export
M_step <- function(E_fit, params, X, Y, orth_type = c("SVD","QR")){
  orth_x = ssq(params$Wo) > 0
  orth_y = ssq(params$Co) > 0
  orth_type = match.arg(orth_type)
  with(E_fit,{

    N = nrow(X)
    r = ncol(mu_T)
    rx = ncol(mu_To)
    ry = ncol(mu_Uo)
    params$B = Sut %*% MASS::ginv(Stt) * diag(1,r)
    params$SigT = Stt*diag(1,r)
    params$SigTo = Stoto*diag(1,rx)
    params$SigUo = Suouo*diag(1,ry)
    params$SigH = Shh*diag(1,r)#abs(Suu - 2*Sut%*%params_old$B + Stt%*%params_old$B^2)
    params$sig2E = See
    params$sig2F = Sff

    params$W = orth(t(t(mu_T) %*% X/N) - params$Wo%*%t(Stto),type = orth_type)#%*%MASS::ginv(Stt)
    params$C = orth(t(t(mu_U) %*% Y/N) - params$Co%*%t(Suuo),type = orth_type)#%*%MASS::ginv(Suu)

    params$Wo = suppressWarnings(orth_x*orth(t(t(mu_To) %*% X/N) - params$W%*%Stto,type = orth_type))#%*%MASS::ginv(Stoto)
    params$Co = suppressWarnings(orth_y*orth(t(t(mu_Uo) %*% Y/N) - params$C%*%Suuo,type = orth_type))#%*%MASS::ginv(Suouo)
    params
  })
}

#' Jitter PO2PLS parameters
#'
#' To be rewritten
#'
#' @inheritParams E_step
#' @param amount Amount of jitter
#'
#' @keywords internal
#' @export
jitter_params <- function(params, amount = NULL){
  suppressWarnings(params[1:4] <- lapply(params[1:4], function(e) sign(ssq(e))*orth(jitter(e,amount = 1))))
  params
}

# diagnostics.PO2PLS <- function(th, th0){
#   c(
#     W = max(abs(crossprod(th$W,th0$W))),
#     C = max(abs(crossprod(th$C,th0$C))),
#     Wo = max(abs(crossprod(th$Wo,th0$Wo))),
#     Co = max(abs(crossprod(th$Co,th0$Co))),
#     varTo_T = sum(diag(th$SigTo))/sum(diag(th$SigT))/ncol(th$Wo)*ncol(th$W),
#     varUo_U = sum(diag(th$SigUo))/sum(diag(th$SigT%*%th$B+th$SigH))/ncol(th$Co)*ncol(th$C),
#     varU_T = sum(diag(th$SigT%*%th$B+th$SigH))/sum(diag(th$SigT))
#   )
# }

#' Perform O2-PLS with two-way orthogonal corrections
#'
#' NOTE THAT THIS FUNCTION DOES NOT CENTER NOR SCALES THE MATRICES! Any normalization you will have to do yourself.
#' It is best practice to at least center the variables though.
#'
#' @param X Numeric matrix. Other types will be coerced to matrix with \code{as.matrix} (if this is possible)
#' @param Y Numeric matrix. Other types will be coerced to matrix with \code{as.matrix} (if this is possible)
#' @param r Positive integer. Number of joint PLS components. Must be positive!
#' @param rx Non-negative integer. Number of orthogonal components in \eqn{X}. Can be 0
#' @param ry Non-negative integer. Number of orthogonal components in \eqn{Y}. Can be 0
#' @param steps Positive integer. Number of EM steps to perform
#' @param tol Positive double. Tolerance of deciding if the likelihood increment is small enough to conclude convergence.
#' @param init_param Character. Should be one of "o2m", "random" or "unit". Specifies which kind of parameters should be generated.
#' @param orth_type Character. One of "SVD" or "QR". Best left set to "SVD"
#' @param random_restart Not to be used
#' @param homogen_joint Boolean. Should U=T be assumed? For simulation purposes to mimic SIFA.
#' @param null_B Boolean. Should B=0 be assumed? For simulation purposes
#' @param verbose Boolean. Should output about time and convergence state be printed?
#'
#' @return A list with
#' \describe{
#' \item{parameters}{Estimated PO2PLS parameters}
#' \item{latent_vars}{Conditional expectation and variances of latent variables}
#' \item{meta_data}{Meta data to be used for \code{print} and \code{summary}}
#' }
#'
#' @export
PO2PLS <- function(X, Y, r, rx, ry, steps = 1e5, tol = 1e-6, init_param=c("o2m", "random", "unit"),
                   orth_type = "SVD", random_restart = FALSE, homogen_joint = FALSE, null_B = FALSE,
                   verbose = TRUE){

  # =============================
  if(!is.matrix(X)){
    message("X has class ",class(X),", trying to convert with as.matrix.",sep="")
    X <- as.matrix(X)
  }
  if(!is.matrix(Y)){
    message("Y has class ",class(Y),", trying to convert with as.matrix.",sep="")
    Y <- as.matrix(Y)
  }
  if (length(r) > 1 | length(rx) > 1 | length(ry) > 1)
    stop("Number of components should be scalars, not vectors")
  if (ncol(X) < r + rx)
    stop("r + rx = ", r + rx, " exceeds # columns in X = ", ncol(X))
  if (ncol(Y) < r + ry)
    stop("r + ry = ", r + ry, " exceeds # columns in Y = ", ncol(Y))
  if (rx != round(abs(rx)) || ry != round(abs(ry)))
    stop("rx and ry should be non-negative integers")
  if (steps != round(abs(steps)))
    stop("max_iterations should be a non-negative integer")
  if (tol < 0)
    stop("tol should be non-negative")
  if (nrow(X) < r + max(rx, ry))
    stop("r + max(rx, ry) = ", r + max(rx, ry), " exceeds sample size N = ",
         nrow(X))
  if (nrow(X) == r + max(rx, ry))
    warning("r + max(rx, ry) = ", r + max(rx, ry), " equals sample size")
  if (r != round(abs(r)) || r <= 0) {
    stop("r should be a positive integer")
  }
  if (any(abs(colMeans(X)) > 1e-05)) {
    message("Data is not centered, proceeding...")
  }
  # ==============================


  if(all(c("W","Wo","C","Co","B","SigT","SigTo","SigUo","SigH","sig2E","sig2F") %in% names(init_param)))
    {message('using old fit \n'); params <- init_param}
  else {
    init_param <- match.arg(init_param)
    if(r+max(rx,ry) <= min(ncol(X),ncol(Y)) && init_param == "o2m")
      {
        params <- generate_params(X, Y, r, rx, ry, type = "o2m")
      }
    else
      {
      if(r+max(rx,ry) > min(ncol(X),ncol(Y)) && init_param == "o2m")
        {
        cat("** NOTE: Too many components for init_param='o2m', switched to init_param='unit'**.\n\n");
        init_param = "unit"
        }
        params <- generate_params(X, Y, r, rx, ry, type = init_param)
      }
    }

  logl = 0*0:steps
  tic <- proc.time()
  if(verbose) print(paste('started',date()))

  i_rr <- 0
  random_restart_original <- random_restart
  random_restart <- TRUE
  while(random_restart){

    if(i_rr > 0) {
      message("Log-likelihood: ", logl[i+1])
      message(paste("random restart no",i_rr))
    }
    params_max <- params
    for(i in 1:steps){
      E_next = E_step(X, Y, params)
      params_next = M_step(E_next, params, X, Y, orth_type = orth_type)
      if(homogen_joint){
        params_next$B <- diag(1, r)
        params_next$SigH <- diag(1e-4, r)
      }
      if(null_B) params_next$B %<>% multiply_by(0)
      params_next$B <- abs(params_next$B)

      if(i == 1) logl[1] = E_next$logl
      logl[i+1] = E_next$logl
      if(i > 1 && abs(logl[i+1]-logl[i]) < tol) {
        if(verbose) {
          print(data.frame(row.names = "", steps = i, time = unname(proc.time()-tic)[3], diff = logl[i+1]-logl[i], logl = logl[i+1]))
        }
        break
      }
      if(verbose & i %in% c(1e1, 1e2, 1e3, 5e3, 1e4, 4e4)) {
        print(data.frame(row.names = "", steps = i, time = unname(proc.time()-tic)[3], diff = logl[i+1]-logl[i], logl = logl[i+1]))
      }
      if(random_restart_original & logl[i+1] > max(logl[1:i])) params_max <- params_next
      params = params_next
    }
    if(!any(diff(logl[-1]) < -1e-10) | !random_restart_original) {
      random_restart = FALSE
      break
    }
    i_rr <- i_rr + 1
    params <- jitter_params(params)
    params[-(1:4)] <- generate_params(X, Y, r, rx, ry, type = 'r')[-(1:4)]
  }
  # params <- params_max
  signB <- sign(diag(params$B))
  params$B <- params$B %*% diag(signB,r)
  params$C <- params$C %*% diag(signB,r)
  ordSB <- order(diag(params$SigT %*% params$B), decreasing = TRUE)
  params$W <- params$W[,ordSB]
  params$C <- params$C[,ordSB]
  params$SigT <- params$SigT[ordSB,ordSB]
  params$SigH <- params$SigH[ordSB,ordSB]
  params$B <- params$B[ordSB,ordSB]
  params[1:9] <- lapply(params[1:9], as.matrix)
  row.names(params$C) <- row.names(params$Co) <- colnames(Y)
  row.names(params$W) <- row.names(params$Wo) <- colnames(X)

  message("Nr steps was ", i)
  message("Negative increments: ", any(diff(logl[0:i+1]) < 0),
          "; Last increment: ", signif(logl[i+1]-logl[i],4))
  message("Log-likelihood: ", logl[i+1])
  outputt <- list(params = params, logl = logl[0:i+1][-1])
  outputt$flags <- list(time = unname(proc.time()-tic)[3],
                        call = match.call(),
                        converg = (logl[i+1]-logl[i]) < tol)
  class(outputt) <- "PO2PLS"
  outputt <- PO2PLS_to_po2m(outputt,X,Y)
  if(verbose) print(paste('ended',date()))
  return(outputt)
}

# PO2PLS_slow <- function(X, Y, r, rx, ry, steps = 1e5, tol = 1e-6, init_param='o2m',
#                    orth_type = "SVD", random_restart = FALSE){
#   if(all(c("W","Wo","C","Co","B","SigT","SigTo","SigUo","SigH","sig2E","sig2F") %in% names(init_param))) {message('using old fit \n'); params <- init_param}
#   else {params <- generate_params(X, Y, r, rx, ry, type = init_param)}
#   logl = 0*0:steps
#   tic <- proc.time()
#   print(paste('started',date()))
#
#   i_rr <- 0
#   random_restart_original <- random_restart
#   random_restart <- TRUE
#   while(random_restart){
#
#     if(i_rr > 0) {
#       message("Log-likelihood: ", logl[i+1])
#       message(paste("random restart no",i_rr))
#     }
#     params_max <- params
#     for(i in 1:steps){
#       E_next = E_step_slow(X, Y, params)
#       params_next = M_step(E_next, params, X, Y, orth_type = orth_type)
#       params_next$B <- abs(params_next$B)
#
#       if(i == 1) logl[1] = E_next$logl
#       logl[i+1] = E_next$logl
#       if(i > 1 && abs(logl[i+1]-logl[i]) < tol) break
#       if(i %in% c(1e1, 1e2, 1e3, 5e3, 1e4, 4e4)) {
#         print(data.frame(row.names = 1, steps = i, time = unname(proc.time()-tic)[3], diff = logl[i+1]-logl[i], logl = logl[i+1]))
#       }
#       if(logl[i+1] > max(logl[1:i])) params_max <- params_next
#       params = params_next
#     }
#     if(!any(diff(logl[-1]) < -1e-10) | !random_restart_original) {
#       random_restart = FALSE
#       break
#     }
#     i_rr <- i_rr + 1
#     params <- jitter_params(params)
#     params[-(1:4)] <- generate_params(X, Y, r, rx, ry, type = 'r')[-(1:4)]
#   }
#   # params <- params_max
#   signB <- sign(diag(params$B))
#   params$B <- params$B %*% diag(signB,r)
#   params$C <- params$C %*% diag(signB,r)
#   ordSB <- order(diag(params$SigT %*% params$B), decreasing = TRUE)
#   params$W <- params$W[,ordSB]
#   params$C <- params$C[,ordSB]
#   message("Nr steps was ", i)
#   message("Negative increments: ", any(diff(logl[0:i+1]) < 0),
#           "; Last increment: ", signif(logl[i+1]-logl[i],4))
#   message("Log-likelihood: ", logl[i+1])
#   outputt <- list(params = params_next, logl = logl[0:i+1][-1])
#   class(outputt) <- "PO2PLS"
#   return(outputt)
# }
#
# plot_accur.PO2PLS <- function(fit){
#   library(ggplot2)
#   library(gridExtra)
#   fit_o2m <- o2m(X,Y,ncol(parms$W),ncol(parms$Wo),ncol(parms$Co))
#   g1 <- ggplot(reshape2::melt(fit$diags[,1:4]), aes(x=Var1,y=value)) + geom_line(aes(col=Var2,linetype=grepl('o',Var2)))
#   g2 <- ggplot(reshape2::melt(fit$diags[,5:6]), aes(x=Var1,y=value)) + geom_line(aes(col=Var2))
#   g3 <- ggplot(reshape2::melt(fit$diags[,7]), aes(x=1:nrow(fit$diags),y=value)) + geom_line()
#   g4 <- qplot(x=1:length(fit$logl), y=fit$logl, geom='line')
#   grid.arrange(g1,g2,g3,g4)
#   print("### MAX ABS CROSSPROD WITH TRUE LOADINGS")
#   print(apply(fit$diags,2,function(e) c(min=which.min(e), max=which.max(e))))
#   print("### MAX VALUES FOR O2PLS")
#   print(c(
#     W = max(abs(crossprod(fit_o2m$W.,parms$W))),
#     C = max(abs(crossprod(fit_o2m$C.,parms$C))),
#     Wo = max(abs(crossprod(orth(fit_o2m$P_Y),parms$Wo))),
#     Co = max(abs(crossprod(orth(fit_o2m$P_X),parms$Co)))
#   ))
#   print("### MAX CROSSPROD JOINT AND ORTHOGONAL SPACE")
#   print(c(W=max(abs(crossprod(parms$W,parms$Wo))), C=max(abs(crossprod(parms$C,parms$Co)))))
# }


#' Calculate covariance matrix of PO2PLS
#'
#' @param fit A PO2PLS fit
#'
#' @export
cov.PO2PLS <- function(fit){
  with(fit$par,
       blockm(W%*%SigT%*%t(W)+Wo%*%SigTo%*%t(Wo) ,
              W%*%SigT%*%B%*%t(C) ,
              C%*%(SigT%*%B^2+SigH)%*%t(C)+Co%*%SigUo%*%t(Co)))
}

#' Calculate the variance covariance matrix of the estimated PO2PLS parameters
#'
#' @inheritParams variances_inner.po2m
#' @param type_var String. Type of covariance matrix sought
#'
#' @return A covariance matrix and standard errors
#' @keywords internal
#'
# variances.PO2PLS <- function(fit, data, type_var = c("complete","component","variable")){
#   type_var = match.arg(type_var)
#   N = nrow(data)
#   p = nrow(fit$par$W)
#   q = nrow(fit$par$C)
#   r = ncol(fit$par$W)
#   rx= ncol(fit$par$Wo)
#   ry= ncol(fit$par$Co)
#   SigU = with(fit$par, SigT%*%B^2 + SigH)
#
#   dataEF <- cbind(data[,1:p]/fit$par$sig2E, data[,-(1:p)]/fit$par$sig2F)
#
#   Gamma = with(fit$par, {
#     rbind(cbind(W, matrix(0,p,r), Wo, matrix(0,p,ry)),
#           cbind(matrix(0,q,r), C, matrix(0,q,rx), Co))
#     })
#   SigmaZ = with(fit$par,{
#     blockm(
#       blockm(
#         blockm(SigT, SigT%*%B, SigU),
#         matrix(0,2*r,rx), SigTo),
#       matrix(0,2*r+rx,ry), SigUo)
#   })
#   GammaEF <- Gamma
#   GammaEF[1:p,c(1:r,2*r+1:rx)] <- 1/fit$par$sig2E* GammaEF[1:p,c(1:r,2*r+1:rx)]
#   GammaEF[-(1:p),c(r+1:r,2*r+rx+1:ry)] <- 1/fit$par$sig2F* GammaEF[-(1:p),c(r+1:r,2*r+rx+1:ry)]
#   GGef <- t(Gamma) %*% GammaEF
#   invZtilde <- MASS::ginv(MASS::ginv(SigmaZ) + GGef)
#   VarZc <- SigmaZ - (t(Gamma %*% SigmaZ) %*% GammaEF) %*% SigmaZ +
#     (t(Gamma %*% SigmaZ) %*% GammaEF) %*% invZtilde %*% GGef %*% SigmaZ
#
#   EZc <- data %*% (GammaEF %*% SigmaZ)
#   EZc <- EZc - data %*% ((GammaEF %*% invZtilde)  %*% (GGef %*% SigmaZ))
#   Szz = VarZc + crossprod(EZc)/N
#   E3Zc <- EZc%*%crossprod(EZc)/N + 3*EZc%*%VarZc
#   E4Zc <- (crossprod(EZc)/N)^2 + 6*(crossprod(EZc)/N)%*%VarZc + 3*crossprod(VarZc)
#
#   if(type_var == "component"){
#     Iobs = lapply(1:ncol(Gamma), function(comp_k) {
#       Bobs <- diag(c(rep(1/fit$par$sig2E,p), rep(1/fit$par$sig2F,q)))*Szz[comp_k,comp_k]
#       SSt1 <- Szz[comp_k,comp_k]*crossprod(dataEF)/N
#       SSt2 <- crossprod(dataEF, E3Zc[,comp_k]%*%t(GammaEF[,comp_k]))/N
#       SSt3 <- GammaEF[,comp_k] %*% as.matrix(E4Zc[comp_k,comp_k]) %*% t(GammaEF[,comp_k])
#       list(Bobs = Bobs, SSt1 = SSt1, SSt2 = SSt2, SSt3 = SSt3, SEs = -diag(MASS::ginv((Bobs - SSt1 + SSt2 + t(SSt2) - SSt3))))
#     })
#     return(Iobs)
#   }
#
#   if(type_var == "variable"){
#     Sigmaef_inv = (1/rep(c(fit$par$sig2E,fit$par$sig2F),c(p,q)))
#     Iobs = list()
#     Iobs$Bobs = lapply(1:ncol(data), function(j) Reduce(`+`, lapply(1:N, function(i) Szz*Sigmaef_inv[j])))
#     Iobs$SSt1 = lapply(1:ncol(data), function(j) Reduce(`+`, lapply(1:N, function(i) data[i,j]^2*Sigmaef_inv[j]^2*Szz)))
#     Iobs$SSt2 = lapply(1:ncol(data), function(j) Reduce(`+`, lapply(1:N, function(i) data[i,j]*Sigmaef_inv[j]^2*E3Zc[i,]%*%t(Gamma[j,]))))
#     Iobs$SSt3 = lapply(1:ncol(data), function(j) Reduce(`+`, lapply(1:N, function(i) Sigmaef_inv[j]^2*E4Zc%*%Gamma[j,]%*%t(Gamma[j,]))))
#     #Iobs$SEs = with(Iobs, -diag(MASS::ginv((Bobs - SSt1 + SSt2 + t(SSt2) - SSt3))))
#     return(Iobs)
#   }
#
#   if(type_var == "complete"){
#     Sigmaef_inv = diag(1/rep(c(fit$par$sig2E,fit$par$sig2F),c(p,q)))
#     Iobs = list()
#     Iobs$Bobs = Reduce(`+`, lapply(1:N, function(i) Szz %x% Sigmaef_inv))
#     Iobs$muS  = Reduce(`+`, lapply(1:N, function(i) EZc[i,] %x% (Sigmaef_inv %*% (data[i,])) ))
#     Iobs$VarS = Reduce(`+`, lapply(1:N, function(i) VarZc %x% (Sigmaef_inv^2 %*% tcrossprod(data[i,])) -
#                                      (E4Zc %x% Sigmaef_inv^2) %*% tcrossprod(c(Gamma)) ))
#     Iobs$SSt  = Reduce(`+`, lapply(1:N, function(i) Iobs$VarS - tcrossprod(Iobs$muS) ))
#     Iobs$Iobs = with(Iobs, (Bobs - SSt/N))
#     Iobs$Iobs = with(Iobs, Iobs[-which(c(Gamma)==0),-which(c(Gamma)==0)])
#     Iobs$SEs = (diag(solve(Iobs$Iobs)))
#     return(Iobs)
#   }
# }

#' Calculate standard errors for the inner relation coefficient B
#'
#' @param fit A PO2PLS fit of class po2m
#' @inheritParams PO2PLS
#'
#' @return A vector with the standard errors for B per component
#'
#' @export
variances_inner.po2m <- function(fit, X, Y){
  tmp.Estep <- E_step(X, Y, fit$par)
  with(tmp.Estep,
       Stt%*%solve(fit$par$SigH) -
         (crossprod(Sut) - crossprod(Stt)%*%fit$par$B^2)%*%
         solve(fit$par$SigH^2)) %>%
    multiply_by(nrow(X)) %>% solve %>% diag %>% abs %>% raise_to_power(0.5)
}

#' Calculate standard errors for the inner relation coefficient B
#'
#' @param fit A PO2PLS fit of class po2m
#' @inheritParams PO2PLS
#' @param rep.cores Positive integer. Number of cores.
#' @param rep.K Positive integer. Number of repeats.
#' @param ... Additional arguments for the PO2PLS fit. In particular, one may specify \code{steps=100, init_param=fit$par, verbose=FALSE}
#'
#' @return A vector with the standard errors for B per component
#' @keywords internal
#' @export
bootstrap_inner.po2m <- function(fit, X, Y, rep.cores = 1, rep.K = 5, ...){

  r <- ncol(fit$par$W)
  rx <- ncol(fit$par$Wo)*sign(ssq(fit$par$Wo))
  ry <- ncol(fit$par$Co)*sign(ssq(fit$par$Co))
  rep.indx <- replicate(rep.K, sample(nrow(X), replace = TRUE))

  cl_bootstr <- NULL
  on.exit({
    if (!is.null(cl_bootstr)) {stopCluster(cl_bootstr); gc()}
  })
  if (Sys.info()[["sysname"]] == "Windows" && rep.cores > 1) {
    cl_bootstr <- makePSOCKcluster(rep.cores)
    clusterEvalQ(cl_bootstr, {library(OmicsPLS); library(PO2PLS); library(tidyverse)})
    clusterExport(cl_bootstr, varlist = ls(), envir = environment())
    boot.par <- parLapply(mc.cores = rep.cores, 1:rep.K,
                            FUN = function(rep.i) {
                              fit_rep <- suppressMessages(PO2PLS((X[rep.indx[,rep.i], ]), (Y[rep.indx[,rep.i], ]), r, rx, ry, ...))
                              return(diag(fit_rep$par$B))
                            })
  }
  else {
    boot.par <- mclapply(mc.cores = rep.cores, 1:rep.K,
                          FUN = function(rep.i) {
                            fit_rep <- suppressMessages(PO2PLS((X[rep.indx[,rep.i], ]), (Y[rep.indx[,rep.i], ]), r, rx, ry, ...))
                            return(diag(fit_rep$par$B))
                          })
  }

  return(apply(do.call(what=cbind, args = boot.par), 1,sd))
}
selbouhaddani/PO2PLS documentation built on Oct. 18, 2024, 9:36 a.m.
rdrr.io home R language documentation Run R code online
CRAN packages Bioconductor packages R-Forge packages GitHub packages
Note that we can't provide technical support on individual packages. You should contact the package authors for that.
selbouhaddani/PO2PLS
Probabilistic Two-Way Orthogonal Partial Least Squares

R/PO2PLS_functions.R
In selbouhaddani/PO2PLS: Probabilistic Two-Way Orthogonal Partial Least Squares

Defines functions bootstrap_inner.po2m variances_inner.po2m cov.PO2PLS PO2PLS jitter_params M_step E_step_test E_step E_step_slow Lemma generate_data generate_params blockm

Documented in blockm bootstrap_inner.po2m cov.PO2PLS E_step E_step_slow E_step_test generate_data generate_params jitter_params Lemma M_step PO2PLS variances_inner.po2m

R Package Documentation

Browse R Packages

We want your feedback!

selbouhaddani/PO2PLS Probabilistic Two-Way Orthogonal Partial Least Squares

R/PO2PLS_functions.R In selbouhaddani/PO2PLS: Probabilistic Two-Way Orthogonal Partial Least Squares

Defines functions bootstrap_inner.po2m variances_inner.po2m cov.PO2PLS PO2PLS jitter_params M_step E_step_test E_step E_step_slow Lemma generate_data generate_params blockm

Documented in blockm bootstrap_inner.po2m cov.PO2PLS E_step E_step_slow E_step_test generate_data generate_params jitter_params Lemma M_step PO2PLS variances_inner.po2m

R Package Documentation

Browse R Packages

We want your feedback!

selbouhaddani/PO2PLS
Probabilistic Two-Way Orthogonal Partial Least Squares

R/PO2PLS_functions.R
In selbouhaddani/PO2PLS: Probabilistic Two-Way Orthogonal Partial Least Squares