priogrid: PRIOGrid Replication Code

Documented in gen_waterrisk gen_waterrisk_monthly

#' @title waterrisk
#'
#' @description Generate variable measuring overall waterrisk, drawn from the yearly Aqueduct 3.0 dataset.
#' Please cite: Hofste, R., S. Kuzma, S. Walker, E.H., Sutanudjaja, et. al. 2019. “Aqueduct 3.0: Updated Decision-Relevant Global Water Risk Indicators.” Technical Note. Washington, DC: World Resources Institute. Available online at: https://www.wri.org/publication/aqueduct-30.
#'
#' @param input_folder path to [pg-folder].
#'
#' @export
gen_waterrisk <- function(input_folder){
  waterrisk <- sf::read_sf(file.path(input_folder, "waterrisk", "Y2019M07D12_Aqueduct30_V01", "baseline",
                                     "annual", "y2019m07d11_aqueduct30_annual_v01.gpkg"))

  waterrisk <- waterrisk %>%
    dplyr::select(waterrisk = bws_cat) %>%
    dplyr::mutate(waterrisk = dplyr::na_if(waterrisk, -1))

  suppressMessages(spare_mtx <- sf::st_intersects(waterrisk, waterrisk, sparse = TRUE))
  whichna <- which(is.na(waterrisk$waterrisk)) # Which units have NA
  for(x in whichna){
    # print(x)
    waterrisk$waterrisk[x] <- mean(waterrisk$waterrisk[spare_mtx[[x]]], na.rm = TRUE)
  }

  waterrisk_sum <- priogrid::vector_to_pg(waterrisk, variable = "waterrisk", need_aggregation = TRUE, fun = "sum")
  waterrisk_sum <- priogrid::raster_to_tibble(waterrisk_sum, add_pg_index = T)

  waterrisk_count <- priogrid::vector_to_pg(waterrisk, variable = "waterrisk", need_aggregation = TRUE, fun = "count")
  waterrisk_count <- priogrid::raster_to_tibble(waterrisk_count, add_pg_index = TRUE)

  waterrisk_count <- waterrisk_count %>% dplyr::rename("count" = "waterrisk")

  waterrisk <- dplyr::left_join(waterrisk_sum, waterrisk_count, by = c("x", "y", "pgid"))
  waterrisk <- waterrisk %>%
    dplyr::mutate(waterrisk = waterrisk/count)

  waterrisk$count <- NULL

  waterrisk <- priogrid::interpolate_crossection(waterrisk, variable = "waterrisk", lon = "x", lat = "y",
                                                 input_folder = input_folder)

  pg <- priogrid::raster_to_tibble(prio_blank_grid())
  waterrisk <- dplyr::left_join(waterrisk, pg, by = c("x", "y"))

  return(waterrisk)
}


#' @title waterrisk monthly
#'
#' @description Generate variable measuring monthly waterrisk, drawn from the monthly Aqueduct 3.0 dataset.
#' Please cite: Hofste, R., S. Kuzma, S. Walker, E.H., Sutanudjaja, et. al. 2019. “Aqueduct 3.0: Updated Decision-Relevant Global Water Risk Indicators.” Technical Note. Washington, DC: World Resources Institute. Available online at: https://www.wri.org/publication/aqueduct-30.
#'
#' @param input_folder path to [pg-folder].
#'
#' @export
gen_waterrisk_monthly <- function(input_folder){
  waterrisk <- sf::read_sf(file.path(input_folder, "waterrisk", "Y2019M07D12_Aqueduct30_V01", "baseline",
                                     "monthly", "y2019m07d12_rh_aqueduct30_data_download_monthly_v01.gpkg"))
  waterrisk_long <- waterrisk %>%
    as.data.frame() %>%
    dplyr::select(pfaf_id,
                  bws_01_cat,
                  bws_02_cat,
                  bws_03_cat,
                  bws_04_cat,
                  bws_05_cat,
                  bws_06_cat,
                  bws_07_cat,
                  bws_08_cat,
                  bws_09_cat,
                  bws_10_cat,
                  bws_11_cat,
                  bws_12_cat) %>%
    tidyr::pivot_longer(cols = bws_01_cat:bws_12_cat,
                        names_to = "month",
                        values_to = "waterrisk")

    waterrisk <- waterrisk %>%
      dplyr::select(pfaf_id) %>%
      dplyr::full_join(waterrisk_long, by = "pfaf_id") %>%
      dplyr::mutate(month = readr::parse_number(as.character(month)),
                    waterrisk = dplyr::na_if(waterrisk, -1),
                    waterrisk = dplyr::na_if(waterrisk, -9999))

  full_pg <- tibble::tibble()
  for(i in seq(1, 12, 1)){
    month_df <- waterrisk %>% dplyr::filter(month == i)

    suppressMessages(spare_mtx <- sf::st_intersects(month_df, month_df, sparse = TRUE)) # Create contiguity matrix

    whichna <- which(is.na(month_df$waterrisk)) # Which units have NA
    for(x in whichna){
      # print(x)
      month_df$waterrisk[x] <- mean(month_df$waterrisk[spare_mtx[[x]]],na.rm=TRUE)
    } # Loop through and calculate mean from contiguous units

    df_sum <- priogrid::vector_to_pg(month_df, variable = "waterrisk", fun = "sum")
    temp_sum <- priogrid::raster_to_tibble(df_sum, add_pg_index = TRUE) %>%
      dplyr::mutate(month = i)

    df_count <- priogrid::vector_to_pg(month_df, variable = "waterrisk", fun = "count")
    temp_count <- priogrid::raster_to_tibble(df_count, add_pg_index = TRUE) %>%
      dplyr::mutate(month = i) %>%
      dplyr::rename("count" = "waterrisk")

    temp <- dplyr::left_join(temp_sum, temp_count, by = c("x", "y", "pgid", "month"))
    temp <- temp %>%
      dplyr::mutate(waterrisk = waterrisk/count)

    temp_ipol <- priogrid::interpolate_crossection(temp, variable = "waterrisk",
                                                   lon = "x", lat = "y", input_folder = input_folder) %>%
      dplyr::mutate(month = i)

    full_pg <- dplyr::bind_rows(full_pg, temp_ipol)
  }

  pg <- priogrid::raster_to_tibble(prio_blank_grid())
  full_pg <- dplyr::left_join(full_pg, pg, by = c("x", "y"))

  return(full_pg)
}