SIDFEx: Tools for the Sea Ice Drift Forecast Experiment (SIDFEx)

Documented in sidfex.fcst.search.extractFromTable

sidfex.fcst.search.extractFromTable <-
  function(index = NULL, indexTable.path = NULL, return.dataframe=TRUE, gid=NULL, mid=NULL, tid=NULL,
           iy=NULL, idoy=NULL, emn=NULL, sy=NULL, sdoy=NULL, py=NULL, pdoy=NULL,
           del=NULL, nt=NULL, fy=NULL, fdoy=NULL, ly=NULL, ldoy=NULL, per=NULL,
           fcstrange=NULL, es=NULL, EnsParentOnly=FALSE, InheritFromParent=FALSE,
           ila=NULL, ilo=NULL, fla=NULL, flo=NULL, lla=NULL, llo=NULL){

    if (is.null(index)) {
      # check if specific directory for indexList is given, otherwise use default
      if (is.null(indexTable.path)) {
        no.indexTable.path=TRUE
        if (file.exists(file.path("~",".SIDFEx"))) {
          source(file.path("~",".SIDFEx"))
          if (exists("indexTable.path.in")) {no.indexTable.path=FALSE}
        }
        if (no.indexTable.path) {
          stop(paste0("With indexTable.path=NULL , indexTable.path.in must be specified in a file ~/.SIDFEx as a line like indexTable.path.in=..."))
        }
      } else {
        indexTable.path.in = indexTable.path
      }
      # open table
      if(file.exists(file.path(indexTable.path.in, "indexTable.rda"))) {
        load(file.path(indexTable.path.in, "indexTable.rda"))
      }
      else {
        print("No indexTable.rda at given location.")
        return(NULL)
      }
      df = rTab
    } else {
      df = index
    }

    if (length(per)>2) {per = NULL; warning("length(per) > 2, parameter 'per' will be ignored")}
    if (length(del)>2) {del = NULL; warning("length(del) > 2, parameter 'del' will be ignored")}
    if (length( nt)>2) {nt  = NULL; warning("length(nt) > 2, parameter 'nt' will be ignored")}

    if (EnsParentOnly) {
      df = df[df$File==df$EnsParentFile,]
    } else if (InheritFromParent) {
      parents = which(df$File==df$EnsParentFile & df$EnsSize>1)
      for (ip in parents) {
        children = which(df$EnsParentFile==df$File[ip] & df$File!=df$File[ip])
        df[children,c(2:6,8:ncol(df))] = df[ip,c(2:6,8:ncol(df))]
      }
    }

    # filter rows by criteria on columns, first the easy ones
    if (!is.null(gid)) {df <- df[df$GroupID %in% gid,]}
    if (!is.null(tid)) {df <- df[df$TargetID %in% tid,]}
    if (!is.null(mid)) {df <- df[df$MethodID %in% mid,]}
    if (!is.null(emn)) {df <- df[df$EnsMemNum %in% emn,]}

    # now take care of (possible) range queries, this min/max thing is an elegant solution for length(<parameter>)=1
    if (!is.null(per)) {df <- df[ which((df$FcstTime <= max(per)) & (df$FcstTime >= min(per))),]}
    if (!is.null(nt)) {df <- df[which((df$nTimeSteps <= max(nt)) & (df$nTimeSteps >= min(nt))),]}
    if (!is.null(del)) {df <- df[which((df$Delay <= max(del)) & (df$Delay >= min(del))),]}
    if (!is.null(es)) {df <- df[which((df$EnsSize <= max(es)) & (df$EnsSize >= min(es))),]}

    if ("InitLat" %in% names(df)) {
      if (!is.null(ila)) {df <- df[ which((df$InitLat <= max(ila)) & (df$InitLat >= min(ila))),]}
      if (!is.null(ilo)) {df <- df[ which((df$InitLon <= max(ilo)) & (df$InitLon >= min(ilo))),]}
      if (!is.null(fla)) {df <- df[ which((df$FirstTimeStepLat <= max(fla)) & (df$FirstTimeStepLat >= min(fla))),]}
      if (!is.null(flo)) {df <- df[ which((df$FirstTimeStepLon <= max(flo)) & (df$FirstTimeStepLon >= min(flo))),]}
      if (!is.null(lla)) {df <- df[ which((df$LastTimeStepLat <= max(lla)) & (df$LastTimeStepLat >= min(lla))),]}
      if (!is.null(llo)) {df <- df[ which((df$LastTimeStepLon <= max(llo)) & (df$LastTimeStepLon >= min(llo))),]}
    } else {
      if (any(!is.null(ila),!is.null(ilo),!is.null(fla),!is.null(flo),!is.null(lla),!is.null(llo))) {
        warning("index does not contain lon-lat columns. To use corresponding arguments, re-generate index with 'add.LatLon=TRUE'")
      }
    }

    # now the ugly stuff (taking care of range queries over different years)
    # initial time
    if(!is.null(iy)){
      if (length(iy)==1 | iy[1]==iy[2]){ # case 1: year and day are only a point query (only one year or iy[1]=iy[2])
        df <- df[df$InitYear == iy[1],]
        if (!is.null(idoy)){
          df <- df[which((df$InitDayOfYear <= max(idoy)) & (df$InitDayOfYear >= min(idoy))),]
        }
      } else if (iy[1]!=iy[2]) { # case 2: year and days are range queries (idoy must have length 2!)
        df <- df[which((df$InitYear==iy[1] & df$InitDayOfYear >= idoy[1])        |
                         (df$InitYear>iy[1] & df$InitYear <iy[2])                 |
                         (df$InitYear==iy[2] & df$InitDayOfYear <= idoy[2])),]
      }
    }

    # first date of forecast
    if(!is.null(fy)){
      if (length(fy)==1 | fy[1]==fy[2]){
        df <- df[df$FirstTimeStepYear == fy[1],]
        if (!is.null(fdoy)){
          df <- df[which((df$FirstTimeStepDayOfYear <= max(fdoy)) & (df$FirstTimeStepDayOfYear >= min(fdoy))),]
        }
      } else if (fy[1]!=fy[2]) {
        df <- df[which((df$FirstTimeStepYear==fy[1] & df$FirstTimeStepDayOfYear >= fdoy[1])        |
                         (df$FirstTimeStepYear > fy[1] & df$FirstTimeStepYear < fy[2])                 |
                         (df$FirstTimeStepYear==fy[2] & df$FirstTimeStepDayOfYear <= fdoy[2])),]
      }
    }

    # last date of forecast
    if(!is.null(ly)){
      if (length(ly)==1 | ly[1]==ly[2]){
        df <- df[df$LastTimeStepYear == ly[1],]
        if (!is.null(ldoy)){
          df <- df[which((df$LastTimeStepDayOfYear <= max(ldoy)) & (df$LastTimeStepDayOfYear >= min(ldoy))),]
        }
      } else if (ly[1]!=ly[2]) {
        df <- df[which((df$LastTimeStepYear==ly[1] & df$LastTimeStepDayOfYear >= ldoy[1])        |
                         (df$LastTimeStepYear > ly[1] & df$LastTimeStepYear < ly[2])                 |
                         (df$LastTimeStepYear==ly[2] & df$LastTimeStepDayOfYear <= ldoy[2])),]
      }
    }

    # year of file processing
    if(!is.null(py)){
      if (length(py)==1 | py[1]==py[2]){
        df <- df[df$ProcessedYear == py[1],]
        if (!is.null(pdoy)){
          df <- df[which((df$ProcessedDayOfYear <= max(pdoy)) & (df$ProcessedDayOfYear >= min(pdoy))),]
        }
      } else if (py[1]!=py[2]) {
        df <- df[which((df$ProcessedYear==sy[1] & df$ProcessedDayOfYear >= pdoy[1])        |
                         (df$ProcessedYear > sy[1] & df$ProcessedYear < py[2])                 |
                         (df$ProcessedYear==sy[2] & df$ProcessedDayOfYear <= pdoy[2])),]
      }
    }


    # date of submission
    if(!is.null(sy)){
      if (length(sy)==1 | sy[1]==sy[2]){
        df <- df[df$SubmitYear == sy[1],]
        if (!is.null(sdoy)){
          df <- df[which((df$SubmitDayOfYear <= max(sdoy)) & (df$SubmitDayOfYear >= min(sdoy))),]
        }
      } else if (sy[1]!=sy[2]) {
        df <- df[which((df$SubmitYear==sy[1] & df$SubmitDayOfYear >= sdoy[1])        |
                         (df$SubmitYear > sy[1] & df$SubmitYear < sy[2])                 |
                         (df$SubmitYear==sy[2] & df$SubmitDayOfYear <= sdoy[2])),]
      }
    }

    # range input (important for daterange input from shiny!)
     if(!is.null(fcstrange)){
       fcst_datemin = as.POSIXct(paste0(df$FirstTimeStepYear, "-",df$FirstTimeStepDayOfYear), format = "%Y-%j", tz = "GMT")
       fcst_datemax = as.POSIXct(paste0(df$LastTimeStepYear, "-",df$LastTimeStepDayOfYear), format = "%Y-%j", tz = "GMT")

       # either (the forecast starts AND/OR ends in the given range) OR (it starts before AND ends after given range)
       df <- df[which(
         (fcst_datemin <= fcstrange[2] &
            fcst_datemin >=  fcstrange[1]) | # case: fcst starts in range

           (fcst_datemax <= fcstrange[2] &
              fcst_datemax >= fcstrange[1]) |  # case: fcst stops in range

           (fcst_datemin < fcstrange[1] &
              fcst_datemax > fcstrange[2])   # case: fcst starts before, stops afterwards
       )
       ,]
    }

    # return list of files or corresponding data frame
    if (!return.dataframe) {
      return(df$File)
    } else {
      return(df)
    }
  }