miRNetR: A companion R package for the miRNet web server

Documented in GetRandomMirTargetGenes GetRandomXenoMirTargetGenes LoadClusterLib LoadDiseaseLib LoadFuncLib LoadGOLib LoadHMDDLib LoadKEGGLib LoadmiRFamLib LoadREACTOMELib LoadTFLib LoadTissueLib

my.mir.target.enrich <- function(adjust.type, fun.type, file.nm, IDs, algo, mode="serial", save.type="network"){
  adjust.type <<- adjust.type;
  fun.type <<- fun.type;
  file.nm <<- file.nm;
  IDs <<- IDs;
  algo <<- algo;
  #save.image("enr.RData");
  
  require(igraph); # keep this here as it is needed for remote calls
  require('RSQLite');
  require('RJSONIO');
  perm.num <- 1000;
  
  # prepare lib
  if(tolower(fun.type) == 'kegg'){
    LoadKEGGLib();
  }else if(tolower(fun.type) == 'reactome'){
    LoadREACTOMELib();
  }else if(tolower(fun.type) == 'mirfamily'){ # when user choose to perform miRNA family enrichment analysis.
    LoadmiRFamLib();
  }else if(tolower(fun.type) == 'tissue'){
    LoadTissueLib();
  }else if(tolower(fun.type) == 'func'){
    LoadFuncLib();
  }else if(tolower(fun.type) == 'hmdd'){
    LoadHMDDLib();
  }else if(tolower(fun.type) == 'cluster'){
    LoadClusterLib();
  }else if(tolower(fun.type) == 'tf'){
    LoadTFLib();
  }else if(tolower(fun.type) == 'disease'){
    LoadDiseaseLib();
  }else{ # GO
    LoadGOLib(fun.type);
  }
  
  mirnet.type <- dataSet$mirnet;
  
  # prepare query, current.mirnet may be subset of all networks
  nodeList <- as_data_frame(current.mirnet, "vertices");
  if(identical(colnames(dataSet$mir.filtered), c("Name1","ID1","Name2","ID2"))){
    colnames(dataSet$mir.filtered) = c("ID","Accession","Gene","Entrez")
  }
  if(data.type == "xeno.mir"){
    if(tolower(fun.type) == 'mirfamily'){
      hit.inx <- dataSet$mir.filtered$miRNA %in% nodeList[,1];
      
      mir.query <- unique(dataSet$mir.filtered$miRNA[hit.inx]);
      my.data <- unique(dataSet$mir.filtered[hit.inx,c("Accession", "miRNA")]); # The original dataset contains miRNA Accession number, you can consider it as entrez id.
      
      ora.vec <- my.data[hit.inx,"Accession"];
      sybls <- my.data[hit.inx,"miRNA"];
      names(ora.vec) <- sybls;
    } else{
      colnms = colnames(dataSet$mir.filtered)
      if("Entrez" %in% colnms){
        hit.inx <- dataSet$mir.filtered$Gene %in% nodeList[, 1];
        
        mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
        
        my.data <- unique(dataSet$mir.filtered[hit.inx,c("Entrez", "Gene")]);
        ora.vec <- my.data[hit.inx, "Entrez"];
        sybls <- my.data[hit.inx, "Gene"];
      }else if("Name2" %in% colnms){
        hit.inx <- dataSet$mir.filtered$Name2 %in% nodeList[, 1];
        mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
        my.data <- unique(dataSet$mir.filtered[hit.inx,c("ID2", "Name2")]);
        ora.vec <- my.data[hit.inx, "ID2"];
        sybls <- my.data[hit.inx, "Name2"];
        
      }else{
        hit.inx <- dataSet$mir.filtered$Target %in% nodeList[, 1];
        
        mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
        my.data <- unique(dataSet$mir.filtered[hit.inx,c("TargetID", "Target")]);
        ora.vec <- my.data[hit.inx, "TargetID"];
        sybls <- my.data[hit.inx, "Target"];
        
      }
      
      names(ora.vec) <- sybls;
    }
  }else{
    if (tolower(fun.type) == 'mirfamily'){
      hit.inx <- dataSet$mir.filtered$ID %in% nodeList[,1];
      mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
      my.data <- unique(dataSet$mir.filtered[hit.inx, c("Accession", "ID")]); # The original dataset contains miRNA Accession number, you can consider it as entrez id.
      
      ora.vec <- my.data[hit.inx, "Accession"];
      sybls <- my.data[hit.inx, "ID"];
      names(ora.vec) <- sybls;
    } else if (tolower(fun.type) == 'tissue'){
      hit.inx <- dataSet$mir.filtered$ID %in% nodeList[,1];
      mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
      my.data <- unique(dataSet$mir.filtered[hit.inx, c("Accession", "ID")]);# The original dataset contains miRNA Accession number, you can consider it as entrez id.
      
      ora.vec <- my.data[hit.inx, "Accession"];
      sybls <- my.data[hit.inx, "ID"];
      names(ora.vec) <- sybls;
    } else if (tolower(fun.type) == 'func'){
      hit.inx <- dataSet$mir.filtered$ID %in% nodeList[,1];
      mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
      my.data <- unique(dataSet$mir.filtered[hit.inx, c("Accession", "ID")]);# The original dataset contains miRNA Accession number, you can consider it as entrez id.
      ora.vec <- my.data[hit.inx, "Accession"];
      sybls <- my.data[hit.inx, "ID"];
      names(ora.vec) <- sybls;
    } else if (tolower(fun.type) == 'hmdd'){
      hit.inx <- dataSet$mir.filtered$ID %in% nodeList[,1];
      mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
      my.data <- unique(dataSet$mir.filtered[hit.inx, c("Accession", "ID")]);# The original dataset contains miRNA Accession number, you can consider it as entrez id.
      ora.vec <- my.data[hit.inx, "Accession"];
      sybls <- my.data[hit.inx, "ID"];
      names(ora.vec) <- sybls;
    } else if (tolower(fun.type) == 'cluster'){
      hit.inx <- dataSet$mir.filtered$ID %in% nodeList[,1];
      mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
      my.data <- unique(dataSet$mir.filtered[hit.inx, c("Accession", "ID")]);# The original dataset contains miRNA Accession number, you can consider it as entrez id.
      ora.vec <- my.data[hit.inx, "Accession"];
      sybls <- my.data[hit.inx, "ID"];
      names(ora.vec) <- sybls;
    } else if (tolower(fun.type) == 'tf'){
      hit.inx <- dataSet$mir.filtered$ID %in% nodeList[,1];
      mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
      my.data <- unique(dataSet$mir.filtered[hit.inx, c("Accession", "ID")]);# The original dataset contains miRNA Accession number, you can consider it as entrez id.
      ora.vec <- my.data[hit.inx, "Accession"];
      sybls <- my.data[hit.inx, "ID"];
      names(ora.vec) <- sybls;
    }else {
      colnms = colnames(dataSet$mir.filtered)
      if("Entrez" %in% colnms){
        hit.inx <- dataSet$mir.filtered$Gene %in% nodeList[, 1];
        
        mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
        
        my.data <- unique(dataSet$mir.filtered[hit.inx,c("Entrez", "Gene")]);
        ora.vec <- my.data[hit.inx, "Entrez"];
        sybls <- my.data[hit.inx, "Gene"];
      }else if("Name2" %in% colnms){
        hit.inx <- dataSet$mir.filtered$Name2 %in% nodeList[, 1];
        
        mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
        my.data <- unique(dataSet$mir.filtered[hit.inx,c("ID2", "Name2")]);
        ora.vec <- my.data[hit.inx, "ID2"];
        sybls <- my.data[hit.inx, "Name2"];
        
      }else{
        hit.inx <- dataSet$mir.filtered$Target %in% nodeList[, 1];
        
        mir.query <- unique(dataSet$mir.filtered$ID[hit.inx]);
        my.data <- unique(dataSet$mir.filtered[hit.inx,c("TargetID", "Target")]);
        ora.vec <- my.data[hit.inx, "TargetID"];
        sybls <- my.data[hit.inx, "Target"];
        
      }
      
      names(ora.vec) <- sybls;
    }
  }
  q.vec <-  unlist(strsplit(IDs, "; "));
  ora.vec <- ora.vec[q.vec];
  
  ora.vec <- ora.vec[!is.na(ora.vec)];
  ora.nms <- names(ora.vec);
  
  # prepare for the result table
  set.size <- length(current.geneset);
  
  res.mat<-matrix(0, nrow=set.size, ncol=4);
  colnames(res.mat) <- c("Total", "Expected", "Hits", "Pval");
  rownames(res.mat) <- names(current.geneset);
  
  # not all query genes can be used, need to cut query to only the universe covered
  hits.inx <- ora.vec %in% current.universe;
  ora.vec <- ora.vec[hits.inx];
  ora.nms <- ora.nms[hits.inx];
  
  q.size<-length(ora.vec);
  
  # get the matched query for each pathway
  hits.query <- lapply(current.geneset,
                       function(x) {
                         ora.nms[ora.vec %in% x];
                       }
  );
  hit.num<-unlist(lapply(hits.query, function(x){length(x)}), use.names=FALSE);
  names(hits.query) <- names(current.geneset);
  
  # total unique gene number
  uniq.count <- length(current.universe);
  
  # unique gene count in each pathway
  set.size <- unlist(lapply(current.geneset, length));
  
  res.mat[,1]<-set.size;
  res.mat[,2]<-q.size*(set.size/uniq.count);
  res.mat[,3]<-hit.num;
  
  if(algo == 'emp'){
    # empirical sampling
    # do stepped permutations
    # assume 1000 ==> 200
    # 300, 500 to remove those genesets that are already >20% , to save computing time
    library(fastmatch); # ~20% faster
    perm.out <- matrix(0, nrow=length(current.geneset), ncol = perm.num);
    if(data.type == "xeno.mir"){
      myRandQs <- GetRandomXenoMirTargetGenes(length(mir.query), perm.num);
    }else{
      myRandQs <- GetRandomMirTargetGenes(length(mir.query), perm.num);
    }
    
    
    if(mode == "parallel"){
      library(foreach)
      library(doParallel)
      
      #setup parallel backend to use many processors
      cores=detectCores()
      cl <- makeCluster(cores[1]-2, type="FORK")
      registerDoParallel(cl)
      
      perm.out <- foreach(i=1:perm.num, .combine=cbind) %dopar% {
        perm.res <- sapply(current.geneset, function(x) {
          require(fastmatch);
          sum(fmatch(myRandQs[[i]], x, nomatch = 0L) > 0L)
        });
      }
      
      stopCluster(cl)
    }else{
      for(i in 1:perm.num){
        perm.out[, i]<- sapply(current.geneset, function(x) {sum(fmatch(myRandQs[[i]], x, nomatch = 0L) > 0L)});
      }
    }
    
    #empirical p from permutation - percentage of number large than original
    hmat <- perm.out - hit.num > 0;
    # now, see if we can combine with previous previous permutation with the same query size
    if(is.null(dataSet$perm.res)){
      dataSet$perm.res <- list();
      dataSet$perm.res <<- dataSet$perm.res
    }
    perm.nm <- paste("Q", length(mir.query), sep="");
    if(perm.nm %in% names(dataSet$perm.res) && nrow(hmat) == nrow(dataSet$perm.res[[perm.nm]])){ # same query size and we can combine
      hmat <- cbind(dataSet$perm.res[[perm.nm]], hmat);
    }
    dataSet$perm.res[[perm.nm]] <- hmat;
    perm.pvals <- apply(hmat, 1, sum)/ncol(hmat);
    
    res.mat[,4] <- perm.pvals;
    dataSet <<- dataSet;
  }else{
    # standard hypergeometric tests use lower.tail = F for P(X>x)
    raw.pvals <- phyper(hit.num-1, set.size, uniq.count-set.size, q.size, lower.tail=F);
    #fdr.pvals <- p.adjust(raw.pvals, "fdr");
    res.mat[,4] <- raw.pvals;
  }
  
  res.mat <- res.mat[hit.num>0,,drop = F];
  hits.query <- hits.query[hit.num>0];
  
  if(nrow(res.mat)> 1){
    # order by p value
    ord.inx<-order(res.mat[,4]);
    res.mat <- signif(res.mat[ord.inx,],3);
    hits.query <- hits.query[ord.inx];
  }
  
  #get gene symbols
  resTable <- data.frame(Pathway=rownames(res.mat), res.mat);
  if(nrow(resTable) == 0){
    current.msg <<- "No hits found for your query!";
    print(current.msg);
    return(0);
  }else{
    #if(nrow(resTable)>100){
    #  resTable <- resTable[c(1:100),]
    #}
  }
  current.msg <<- "Functional enrichment analysis was completed";
  
  adj.p <- signif(p.adjust(resTable[,5], "fdr"),3);
  resTable <- cbind(resTable, FDR=adj.p);
  
  # write json
  hit.num <- paste0(resTable$Hits,"/",resTable$Total); if(length(hit.num) ==1) { hit.num <- matrix(hit.num) };
  fun.ids <- as.vector(resTable$Pathway)
  fun.anot <- hits.query[fun.ids];
  if(length(fun.ids) ==1) { fun.ids <- matrix(fun.ids) };
  pval <- resTable$Pval; if(length(pval) ==1) { pval <- matrix(pval) };
  if(algo == "emp"){
    hit.inx <- pval == 0;
    pval[hit.inx] <- paste("<", 1/perm.num);
  }
  
  json.res <- list(
    fun.anot = fun.anot,
    fun.ids = fun.ids,
    pval = pval,
    adj.p = adj.p,
    hit.num = hit.num
  );
  json.mat <- toJSON(json.res);
  json.nm <- paste(file.nm, ".json", sep="");
  
  sink(json.nm)
  cat(json.mat);
  sink();
  
  CleanMemory();
  # write csv
  # csv.nm <- paste(file.nm, ".csv", sep="");
  fast.write.csv(resTable, file="mirnet_enrichment.csv", row.names=F);
  
  gene.vec <- current.universe;
  sym.vec <- doEntrez2SymbolMapping(gene.vec);
  gene.nms <- sym.vec;

  current.geneset.symb <- lapply(current.geneset, 
                       function(x) {
                         gene.nms[gene.vec%in%unlist(x)];
  }
  );
  path.ids <- as.vector(current.setids[fun.ids]);

  resTable <- data.frame(Pathway=rownames(res.mat), IDs=path.ids, res.mat);
  infoSet <- readSet(infoSet, "infoSet"); 
  infoSet$imgSet$enrTables[[save.type]]$table <- resTable;
  infoSet$imgSet$enrTables[[save.type]]$library <- fun.type
  infoSet$imgSet$enrTables[[save.type]]$algo<-algo;

  infoSet$imgSet$enrTables[[save.type]]$current.geneset <- current.geneset;
  infoSet$imgSet$enrTables[[save.type]]$hits.query <- hits.query;
  infoSet$imgSet$enrTables[[save.type]]$current.setids <- current.setids;
  infoSet$imgSet$enrTables[[save.type]]$res.mat<- res.mat;
  infoSet$imgSet$enrTables[[save.type]]$current.geneset.symb <- current.geneset.symb;


  saveSet(infoSet, "infoSet");
  
  if(.on.public.web){
    return(1);   
  }else{
    return(paste("Enrichment files are downloaded!"))
  }
}

#' Load KEGG Library
#' @export
LoadKEGGLib<-function(){
  kegg.rda <- paste(lib.path, dataSet$org, "/kegg_", dataSet$org, ".rda", sep="");
  print(paste("adding library:", kegg.rda));
  if(.on.public.web){
    load(kegg.rda);
  }else{
    destfile <- paste("kegg_", dataSet$org, ".rda", sep="");
    download.file(kegg.rda, destfile);
    load(destfile);
  }
    current.setlink <- kegg$link;
    current.mset <- kegg$sets;
    set.ids<- names(current.mset);
    names(set.ids) <- names(current.mset) <- kegg$term;

    current.setlink <<- current.setlink;
    current.setids <<- set.ids;
    current.geneset <<- current.mset;
    current.universe <<- unique(unlist(current.geneset));
}

#' Load Reactome Library
#' @export
LoadREACTOMELib<-function(){
    reactome.rda <- paste(lib.path, dataSet$org, "/reactome_", dataSet$org, ".rda", sep="");
    print(paste("adding library:", reactome.rda));
    if(.on.public.web){
      load(reactome.rda);
    }else{
      destfile <- paste("reactome_", dataSet$org, ".rda", sep="");
      download.file(reactome.rda, destfile);
      load(destfile);
    }
    current.mset <- reactome$sets;
    set.ids<- names(current.mset);
    names(set.ids) <- names(current.mset) <- reactome$term;
    current.setlink <<- reactome$link;
    current.setids <<- set.ids;
    current.geneset <<- current.mset;
    current.universe <<- unique(unlist(current.geneset));
}

#' Load Gene Ontology Library
#' @export
LoadGOLib<-function(onto){
    go.rda <- paste(lib.path, dataSet$org, "/go_", tolower(onto), ".rda", sep="");
    print(paste("adding library:", go.rda));
    if(.on.public.web){
      load(go.rda);
    }else{
      destfile <- paste("go_", tolower(onto), ".rda", sep="");
      download.file(go.rda, destfile);
      load(destfile);
      }

    if(tolower(onto) == "bp"){
        current.link <- go_bp$link;
        current.mset <- go_bp$sets;
        set.ids<- names(current.mset);
        names(set.ids) <- names(current.mset) <- go_bp$term;
    }else if(tolower(onto) == "mf"){
        current.link <- go_mf$link;
        current.mset <- go_mf$sets;
        set.ids<- names(current.mset);
        names(set.ids) <- names(current.mset) <- go_mf$term;
    }else{
        current.link <- go_cc$link;
        current.mset <- go_cc$sets;
        set.ids<- names(current.mset);
        names(set.ids) <- names(current.mset) <- go_cc$term;
    }

    current.setlink <<- current.link;
    current.setids <<- set.ids;
    current.geneset <<- current.mset;
    current.universe <<- unique(unlist(current.geneset));
}

# loading miRNA tissue annotation library (human only)
#' Load Tissue Library
#' @export
LoadTissueLib <- function(){
  tissue.rda <- paste(lib.path, "tissue.rda", sep="");
  if(.on.public.web){
  load(tissue.rda);
  }else{
    destfile <- paste("tissue.rda", sep="");
    download.file(tissue.rda, destfile);
    load(destfile);
  }
  print(paste("adding library: ", tissue.rda));
  current.mset <- tissue;
  set.ids <- names(current.mset);
  names(set.ids) <- names(current.mset);
  current.setlink <<- "http://bioeng.swjtu.edu.cn/TSmiR";
  current.setids <<- set.ids;
  current.geneset <<- current.mset;
  current.universe <<- unique(unlist(current.geneset));
}

# loading miRNA functional annotation library Tam 2.0 (human only)
#' Load miRNA Functional Annotation Library
#' @export
LoadFuncLib <- function(){
  func.rda <- paste(lib.path, dataSet$org, "/tam_func.rda", sep="");
  if(.on.public.web){
  load(func.rda);
  }else{
    destfile <- paste("tam_func.rda", sep="");
    download.file(func.rda, destfile);
    load(destfile);
  }
  print(paste("adding library: ", func.rda));
  current.mset <- tam_func$sets;
  set.ids <- names(current.mset);
  names(set.ids) <- names(current.mset) <- tam_func$term;
  current.setlink <<- "http://www.lirmed.com/tam2/";
  current.setids <<- set.ids;
  current.geneset <<- current.mset;
  current.universe <<- unique(unlist(current.geneset));
}

# loading miRNA hmdd disease annotation library Tam 2.0 (human only)
#' Load HMDD Library
#' @export
LoadHMDDLib <- function(){
  hmdd.rda <- paste(lib.path, dataSet$org, "/tam_hmdd.rda", sep="");
  if(.on.public.web){
    load(hmdd.rda);
  }else{
    destfile <- paste("tam_hmdd.rda", sep="");
    download.file(hmdd.rda, destfile);
    load(destfile);
  }
  print(paste("adding library: ", hmdd.rda));
  current.mset <- tam_hmdd$sets;
  set.ids <- names(current.mset);
  names(set.ids) <- names(current.mset) <- tam_hmdd$term;
  current.setlink <<- "http://www.lirmed.com/tam2/";
  current.setids <<- set.ids;
  current.geneset <<- current.mset;
  current.universe <<- unique(unlist(current.geneset));
}


# loading miRNA cluster annotation library Tam 2.0 (human only)
#' Load Cluster Annotation Library
#' @export
LoadClusterLib <- function(){
  cluster.rda <- paste(lib.path, dataSet$org, "/tam_cluster.rda", sep="");
  if(.on.public.web){
    load(cluster.rda);    
  }else{
    destfile <- paste("tam_cluster.rda", sep="");
    download.file(cluster.rda, destfile);
    load(destfile);
  }
  print(paste("adding library: ", cluster.rda));
  current.mset <- tam_cluster$sets;
  set.ids <- names(current.mset);
  names(set.ids) <- names(current.mset) <- tam_cluster$term;
  current.setlink <<- "http://www.lirmed.com/tam2/";
  current.setids <<- set.ids;
  current.geneset <<- current.mset;
  current.universe <<- unique(unlist(current.geneset));
}

# loading miRNA TF annotation library Tam 2.0 (human only)
#' Load Transcription Factor Library
#' @export
LoadTFLib <- function(){
  tf.rda <- paste(lib.path, dataSet$org, "/tam_tf.rda", sep="");
  if(.on.public.web){
    load(tf.rda);
  }else{
    destfile <- paste("tam_tf.rda", sep="");
    download.file(tf.rda, destfile);
    load(destfile);
    }
  print(paste("adding library: ", tf.rda));
  current.mset <- tam_tf$sets;
  set.ids <- names(current.mset);
  names(set.ids) <- names(current.mset) <- tam_tf$term;
  current.setlink <<- "http://www.lirmed.com/tam2/";
  current.setids <<- set.ids;
  current.geneset <<- current.mset;
  current.universe <<- unique(unlist(current.geneset));
}

# loading miRNA TF annotation library Tam 2.0 (human only)
#' Load Disease Library
#' @export
LoadDiseaseLib <- function(){
  disease.path <- paste(lib.path, "hsa/disease.rds", sep="");
  if(.on.public.web){
    diss = readRDS(disease.path);  
  }else{
    destfile <- paste("disease.rds", sep="");
    download.file(disease.path, destfile);
    diss = readRDS(destfile);
  }
  print(paste("adding library: ", disease.path));
  current.mset <- diss$sets;
  set.ids <- names(current.mset);
  names(set.ids) <- names(current.mset) <- diss$term;
  current.setlink <<- diss$link;
  current.setids <<- set.ids;
  current.geneset <<- current.mset;
  current.universe <<- unique(unlist(current.geneset));
}

# loading mirfamily library accroding to the species. The names for set.ids are the same as set.ids.
#' Load miRNA Family Library
#' @export
LoadmiRFamLib <- function(){
  mirfamily.rda <- paste(lib.path, "mirfamily.rda", sep="");
  if(.on.public.web){
    load(mirfamily.rda);    
  }else{
    destfile <- paste("mirfamily.rda", sep="");
    download.file(mirfamily.rda, destfile);
    load(destfile);
  }
  print(paste("adding library: ", mirfamily.rda));
  current.mset <- mirfam[[dataSet$org]];
  set.ids <- names(current.mset);
  names(set.ids) <- names(current.mset);
  current.setlink <<- "http://www.mirbase.org";
  current.setids <<- set.ids;
  current.geneset <<- current.mset;
  current.universe <<- unique(unlist(current.geneset));
}

# return a list of gene targets from the same size but randomly selected mirs
# qSize is the query mir vec size
#' Get Random miRNA Target Genes
#' @export
GetRandomMirTargetGenes <- function(qSize, perm.num){

  db.path <- paste(sqlite.path, "mir2gene.sqlite", sep="");
  if(.on.public.web){
    mir.db <- dbConnect(SQLite(), db.path);
  }else{
    msg <- paste("Downloading", db.path);
    db.name <- gsub(sqlite.path, "", db.path);
    if(!file.exists(db.name)){
      print(msg);
      download.file(db.path, db.name);
    }
    mir.db <- dbConnect(SQLite(), db.name);
  }
    statement <- paste("SELECT mir_id,entrez FROM ",dataSet$org, sep="");
    mir.dic <- .query.sqlite(mir.db, statement);

    # now get the unique mirs
    mirs <- unique(mir.dic[,1]);

    # sample with replacement
    res <- vector(length=perm.num, mode="list");
    for(i in 1:perm.num){
        q.mir <- sample(mirs, qSize, replace = TRUE);
        hit.inx <- mir.dic[,1] %fin% q.mir;
        ora.vec <- unique(mir.dic[hit.inx, 2]);

        # filter ora.vec based on current universe
        res[[i]] <- ora.vec[ora.vec %fin% current.universe];
    }
    return(res);
}

# return a list of gene targets from the same size but randomly selected mirs
# qSize is the query mir vec size
#' Get Random Xeno-miRNA Target Genes
#' @export
GetRandomXenoMirTargetGenes <- function(qSize, perm.num){
    
  db.path <- paste(sqlite.path, "xenomirnet.sqlite", sep="");
  if(.on.public.web){
    mir.db <- dbConnect(SQLite(), db.path);
  }else{
    msg <- paste("Downloading", db.path);
    db.name <- gsub(sqlite.path, "", db.path);
    if(!file.exists(db.name)){
      print(msg);
      download.file(db.path, db.name);
    }
    mir.db <- dbConnect(SQLite(), db.name);
  }  
    statement <- paste("SELECT exo_mirna,entrez FROM ",dataSet$org, sep="");
    mir.dic <- .query.sqlite(mir.db, statement);

    # now get the unique mirs
    mirs <- unique(mir.dic[,1]);

    # sample without replacement
    res <- vector(length=perm.num, mode="list");
    for(i in 1:perm.num){
        q.mir <- sample(mirs, qSize, replace = FALSE);
        hit.inx <- mir.dic[,1] %fin% q.mir;
        ora.vec <- unique(mir.dic[hit.inx, 2]);

        # filter ora.vec based on current universe
        res[[i]] <- ora.vec[ora.vec %fin% current.universe];
    }
    return(res);
}
xia-lab/miRNetR documentation built on June 15, 2025, 11:38 a.m.
rdrr.io home R language documentation Run R code online
CRAN packages Bioconductor packages R-Forge packages GitHub packages
Note that we can't provide technical support on individual packages. You should contact the package authors for that.
xia-lab/miRNetR
A companion R package for the miRNet web server

R/utils_mir_target_enrich.R
In xia-lab/miRNetR: A companion R package for the miRNet web server

Defines functions GetRandomXenoMirTargetGenes GetRandomMirTargetGenes LoadmiRFamLib LoadDiseaseLib LoadTFLib LoadClusterLib LoadHMDDLib LoadFuncLib LoadTissueLib LoadGOLib LoadREACTOMELib LoadKEGGLib my.mir.target.enrich

Documented in GetRandomMirTargetGenes GetRandomXenoMirTargetGenes LoadClusterLib LoadDiseaseLib LoadFuncLib LoadGOLib LoadHMDDLib LoadKEGGLib LoadmiRFamLib LoadREACTOMELib LoadTFLib LoadTissueLib

R Package Documentation

Browse R Packages

We want your feedback!

xia-lab/miRNetR A companion R package for the miRNet web server

R/utils_mir_target_enrich.R In xia-lab/miRNetR: A companion R package for the miRNet web server

Defines functions GetRandomXenoMirTargetGenes GetRandomMirTargetGenes LoadmiRFamLib LoadDiseaseLib LoadTFLib LoadClusterLib LoadHMDDLib LoadFuncLib LoadTissueLib LoadGOLib LoadREACTOMELib LoadKEGGLib my.mir.target.enrich

Documented in GetRandomMirTargetGenes GetRandomXenoMirTargetGenes LoadClusterLib LoadDiseaseLib LoadFuncLib LoadGOLib LoadHMDDLib LoadKEGGLib LoadmiRFamLib LoadREACTOMELib LoadTFLib LoadTissueLib

R Package Documentation

Browse R Packages

We want your feedback!

xia-lab/miRNetR
A companion R package for the miRNet web server

R/utils_mir_target_enrich.R
In xia-lab/miRNetR: A companion R package for the miRNet web server