# OC > Toolkit
# development platform
# workflow per update dati bimestrali
# ----------------------------------------------------------------------------------- #
# workflow per bimestre
# this: 0.2.1 > v0.2.1
# Fare una versione del package per ogni nuovo *bimestre* di monitoraggio.
# Per la nuova versione:
# - modifica "X" in DESCRIPTION (es. 0.1.X); solo in caso di altre modifiche rilevanti
# salire a livello superiori
# - HAND: aggiorna DB per coerenza
# - prep per aggiornare setup/data-raw/po_riclass.csv (con step di confronto manuale con SAS) [non serve "preeteso"]
# - ...
# - prep per aggiornare altro in data (OLD: "data-raw/setup_data.R")
# - setup data nel package
# - setup di progetti_light.csv >>> upload in Drive
# - build con ...
# - ...
# - aggiungere tag in git con $: git tag v0.1.X
# - copia in bkp/_src/octk_0.1.X e fai zip octk_0.1.X.zip
# - integra bkp/versioni.csv
# - carica su google drive
# - invia mail al team
# ----------------------------------------------------------------------------------- #
# test su fix_snai
# progetti <- load_progetti(bimestre = bimestre, visualizzati = FALSE, debug = TRUE, light = FALSE)
# progetti_2 <- fix_progetti(progetti, path_snai <- "ELAB/20211231/SNAI/snai/V.01/output/perimetro_snai.xlsx")
# progetti %>%
# count(X_AMBITO)
#
# progetti %>%
# filter(!is.na(SNAI))
# progetti_2 %>%
# filter(!is.na(SNAI))
#
# progetti_2 %>%
# filter(!is.na(COD_AREA_INT))
#
# rm(progetti, progetti_2)
# ----------------------------------------------------------------------------------- #
# fix OC_DENOM_PROGRAMMATORE per seconda versione di pre-esteso al 31/12/2021 (che contiene soggetti da "esteso")
#
# progetti <- read_csv2(file.path(DATA, "PROGETTI_PREESTESO.csv"), guess_max = 1200000)
# progetti_old <- read_csv2(file.path(DATA, "versione 1", "PROGETTI_PREESTESO.csv"), guess_max = 1200000)
#
# appo <- progetti %>%
# select(-OC_DENOM_PROGRAMMATORE) %>%
# left_join(progetti_old %>%
# select(COD_LOCALE_PROGETTO, OC_DENOM_PROGRAMMATORE),
# by = "COD_LOCALE_PROGETTO")
#
# write.csv2(appo, file.path(DATA, "PROGETTI_PREESTESO_REV.csv"), row.names = FALSE)
#
# progetti <- appo
#
# ----------------------------------------------------------------------------------- #
# prep di dataset in octk
progetti <- load_progetti(bimestre = bimestre, visualizzati = TRUE, debug = TRUE, light = FALSE)
progetti <- fix_progetti(progetti)
# po_linee_azioni.csv
make_matrix_po(bimestre)
# chk <- chk_delta_po("NEW")
# chk <- chk_delta_po("OLD")
# chk %>% count(OC_DESCRIZIONE_PROGRAMMA)
# OLD: HAND: rinominare "po_linee_azioni_NEW.csv" in "po_linee_azioni.csv >>> non serve più
# TODO: voglio sapere cosa manca in po_linee_azioni rispetto al DB programmazione
# strum_att.csv
make_matrix_strum(bimestre)
# delib_cipe.csv
make_matrix_cipe(bimestre)
# prog_comp.csv
make_prog_comp(bimestre)
# patt.csv
make_patt(bimestre)
# comuni
make_comuni()
# ra
progetti %>%
count(COD_RISULTATO_ATTESO, DESCR_RISULTATO_ATTESO) %>%
filter(!(grepl(":::", COD_RISULTATO_ATTESO))) %>%
rename(COD_RIS_ATTESO = COD_RISULTATO_ATTESO) %>%
full_join(octk::ra, by = "COD_RIS_ATTESO") %>%
filter(is.na(QUERY)) %>%
write_csv2(file.path(TEMP, "ra.csv"))
# HAND: estendere lista RA
# ----------------------------------------------------------------------------------- #
# data
# load in package as .rda
source(file.path(getwd(), "setup", "setup_data.R"))
devtools::load_all(path = ".")
# ----------------------------------------------------------------------------------- #
# fix per variabili covid
# MEMO: il file "" in DATA viene dalla versione di "PROGETTI_PREESTESO.csv" del 05/03/2021
# appo <- load_progetti(bimestre = bimestre, visualizzati = FALSE, debug = TRUE)
#
# appo1 <- appo %>%
# distinct(COD_LOCALE_PROGETTO, OC_FLAG_TAG_BENICONF, COVID)
#
# write.csv2(appo1, file.path(DATA, "flag_beniconf_covid.csv"), row.names = FALSE)
#
# # MEMO: la versione di "PROGETTI_PREESTESO.csv" del 05/03/2021 poi è stata cancellata per ripristino della precedente del 22/02/2021
# progetti <- load_progetti(bimestre = bimestre, visualizzati = FALSE, debug = TRUE, light = FALSE)
# appo1 <- read_csv2(file.path(DATA, "flag_beniconf_covid.csv"), guess_max = 1200000)
#
# progetti_2 <- progetti %>%
# left_join(appo1, by = "COD_LOCALE_PROGETTO")
#
# write.csv2(progetti_2, file.path(DATA, "PROGETTI_PREESTESO.csv"), row.names = FALSE)
# ----------------------------------------------------------------------------------- #
# progetti_light e operazioni
# https://readr.tidyverse.org/articles/readr.html#column-specification
# progetti light
# setup_light(bimestre, fix = TRUE)
temp <- paste0("ELAB/", bimestre, "/SNAI/snai/V.01/output/perimetro_snai.xlsx")
# temp <- paste0("ELAB/", "20221231", "/SNAI/snai/V.01/output/perimetro_snai.xlsx")
setup_light(bimestre, fix = TRUE, path_snai = temp) # MEMO: fix per snai che integra variabili che mancano in preesteso
# setup_light(bimestre, fix = FALSE)
# # fix ciclo psc migrati
# fix_ciclo <- read_csv2(file.path(DATA, "PROGETTI_PREESTESO_CICLO.csv"))
# # DEV: qui ci sono tutti i progetti, ma c'è qualcosa a cui cambio il ciclo?
#
# progetti <- read_csv2(file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), guess_max = 1000000)
# appo <- progetti %>%
# left_join(fix_ciclo %>%
# select(COD_LOCALE_PROGETTO, OC_COD_CICLO),
# by = "COD_LOCALE_PROGETTO") %>%
# mutate(x_CICLO = case_when(OC_COD_CICLO == 9 ~ "2000-2006",
# OC_COD_CICLO == 1 ~ "2007-2013",
# OC_COD_CICLO == 2 ~ "2014-2020",
# OC_COD_CICLO == 3 ~ "2021-2027",
# TRUE ~ x_CICLO))
# write.csv2(appo, file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), row.names = FALSE)
#
# temp <- load_progetti(bimestre = bimestre, visualizzati = FALSE, light = FALSE)
# # progetti_fix <- temp %>%
# # select(-OC_COD_CICLO) %>%
# # left_join(fix_ciclo %>%
# # select(COD_LOCALE_PROGETTO, OC_COD_CICLO),
# # by = "COD_LOCALE_PROGETTO") %>%
# # mutate(x_CICLO = case_when(OC_COD_CICLO == 9 ~ "2000-2006",
# # OC_COD_CICLO == 1 ~ "2007-2013",
# # OC_COD_CICLO == 2 ~ "2014-2020",
# # OC_COD_CICLO == 3 ~ "2021-2027"))
# progetti_fix <- temp %>%
# select(-OC_COD_CICLO) %>%
# left_join(fix_ciclo %>%
# select(COD_LOCALE_PROGETTO, OC_COD_CICLO),
# by = "COD_LOCALE_PROGETTO")
# # %>%
# # mutate(x_CICLO = case_when(OC_COD_CICLO == 9 ~ "2000-2006",
# # OC_COD_CICLO == 1 ~ "2007-2013",
# # OC_COD_CICLO == 2 ~ "2014-2020",
# # OC_COD_CICLO == 3 ~ "2021-2027"))
#
# progetti_fix %>% count(OC_COD_CICLO)
# fix ciclo psc migrati (vive sempre perché x_CICLO viene da po_riclass)
progetti <- read_csv2(file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), guess_max = 1000000)
temp <- load_progetti(bimestre = bimestre, visualizzati = FALSE, light = FALSE)
appo <- progetti %>%
left_join(temp %>%
select(COD_LOCALE_PROGETTO, OC_COD_CICLO),
by = "COD_LOCALE_PROGETTO") %>%
mutate(x_CICLO = case_when(x_AMBITO == "FSC" & OC_COD_CICLO == 9 ~ "2000-2006",
x_AMBITO == "FSC" & OC_COD_CICLO == 1 ~ "2007-2013",
x_AMBITO == "FSC" & OC_COD_CICLO == 2 ~ "2014-2020",
x_AMBITO == "FSC" & OC_COD_CICLO == 3 ~ "2021-2027",
TRUE ~ x_CICLO))
appo %>% count(x_AMBITO, x_CICLO, OC_COD_CICLO)
write.csv2(appo, file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), row.names = FALSE)
# operazioni light
# progetti <- load_progetti(bimestre = bimestre, visualizzati = FALSE, debug = TRUE, light = FALSE)
# progetti <- fix_progetti(progetti)
# setup_operazioni(bimestre, progetti, export=TRUE, debug=TRUE)
# setup_operazioni(bimestre, use_sito=TRUE, export=TRUE, debug=TRUE)
setup_operazioni(bimestre, use_sito=TRUE, use_fix=TRUE, export=TRUE, debug=TRUE)
# setup_operazioni(bimestre, progetti=progetti_fix, use_sito=TRUE, export=TRUE, debug=TRUE) # fix ciclo psc migrati
# fix ciclo pac
# operazioni <- read_csv2(file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), guess_max = 1000000)
# appo <- operazioni %>%
# mutate(x_CICLO = if_else(OC_CODICE_PROGRAMMA == "TEMP_MIT_SAR", "2007-2013", x_CICLO))
# write.csv2(appo, file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), row.names = FALSE)
# fix APQ Mari (sposto su 2000-2006)
progetti <- read_csv2(file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), guess_max = 1000000)
appo <- progetti %>%
mutate(x_CICLO = if_else(OC_CODICE_PROGRAMMA == "2007PI004MA007", "2000-2006", x_CICLO))
write.csv2(appo, file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), row.names = FALSE)
operazioni <- read_csv2(file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), guess_max = 1000000)
appo <- operazioni %>%
mutate(x_CICLO = if_else(OC_CODICE_PROGRAMMA == "2007PI004MA007", "2000-2006", x_CICLO))
write.csv2(appo, file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), row.names = FALSE)
# fix elimino progetti SISMA e PSCCAMPANIA
# progetti <- read_csv2(file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), guess_max = 1000000)
# appo <- progetti %>%
# filter(OC_CODICE_PROGRAMMA != "CISAREESISMA", OC_CODICE_PROGRAMMA != "PSCCAMPANIA")
# write.csv2(appo, file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), row.names = FALSE)
#
# operazioni <- read_csv2(file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), guess_max = 1000000)
# appo <- operazioni %>%
# filter(OC_CODICE_PROGRAMMA != "CISAREESISMA", OC_CODICE_PROGRAMMA != "PSCCAMPANIA")
# write.csv2(appo, file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), row.names = FALSE)
# chk vuoti
rm(progetti)
progetti <- read_csv2(file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), guess_max = 1000000)
progetti %>% count(x_CICLO, x_AMBITO)
sum(progetti$OC_FINANZ_TOT_PUB_NETTO, na.rm=TRUE)
progetti %>%
group_by(x_CICLO) %>%
summarise(sum(OC_FINANZ_TOT_PUB_NETTO, na.rm=TRUE))
progetti %>% count(x_MACROAREA, OC_MACROAREA)
operazioni <- read_csv2(file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), guess_max = 1000000)
operazioni %>% count(x_CICLO, x_AMBITO)
operazioni %>% filter(is.na(x_AMBITO)) %>% count(x_CICLO, OC_CODICE_PROGRAMMA)
operazioni %>% filter(is.na(x_CICLO)) %>% count(x_AMBITO, OC_CODICE_PROGRAMMA)
# fix temporaneo per 2127 (va cambiato lato programmazione)
# operazioni <- operazioni %>%
# # mutate(x_AMBITO = if_else(is.na(x_AMBITO), "FSC", x_AMBITO))
# mutate(x_AMBITO = case_when(is.na(x_AMBITO) & OC_CODICE_PROGRAMMA=="2020PCDPCINA001" ~ "SNAI",
# "FSC", x_AMBITO))
# write.csv2(operazioni, file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), row.names = FALSE)
# chk mismatch progetti vs operazioni
chk <- progetti %>%
# get_x_vars(.) %>%
select(COD_LOCALE_PROGETTO, OC_CODICE_PROGRAMMA, x_AMBITO) %>%
full_join(operazioni %>%
select(COD_LOCALE_PROGETTO, OC_CODICE_PROGRAMMA, x_AMBITO),
by = c("COD_LOCALE_PROGETTO", "OC_CODICE_PROGRAMMA")) %>%
mutate(CHK = x_AMBITO.x == x_AMBITO.y) %>%
filter(CHK == FALSE)
chk %>%
count(OC_CODICE_PROGRAMMA, x_AMBITO.x, x_AMBITO.y)
# OC_CODICE_PROGRAMMA x_AMBITO.x x_AMBITO.y n
# <chr> <fct> <chr> <int>
# 1 2007IT001FA005 FSC POC 6 -> 4
# 2 2007IT005FAMG1 FSC POC 4
# MEMO: se sono solo questi sopra è ok per si tratta di sdoppiamenti forzati per direttrici ferroviarie e giustizia civile
# 3 2014TC16M5CB013 CTE ENI 20
# 4 2020PCDPCINA001 FSC SNAI 4116 -> 5173
# MEMO: nuovi programmi fuori da perimetro COE >>> ora non ci sono più!
# 3 2014TC16M5CB013 ENI FESR 7
# NEW:
# 1 2007IT001FA005 PAC FSC 9
# 2 2007IT005FAMG1 FSC PAC 4
# 3 2014TC16M5CB013 ENI FESR 7
write_csv2(chk, file.path(TEMP, "chk_mismatch_progetti_operazioni.csv"))
# # fix
# operazioni <- read_csv2(file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), guess_max = 1000000)
# appo <- operazioni %>%
# mutate(x_AMBITO = if_else(OC_CODICE_PROGRAMMA == "2014TC16M5CB013", "ENI", x_AMBITO))
# write.csv2(appo, file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), row.names = FALSE)
# fix fabio
# progetti <- read_csv2(file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), guess_max = 1000000)
# appo <- progetti %>%
# mutate(OC_FLAG_VISUALIZZAZIONE = if_else(COD_LOCALE_PROGETTO == "6IGRUEI629_73366", 0, OC_FLAG_VISUALIZZAZIONE))
# write.csv2(appo, file.path(DATA, paste0("progetti_light_", bimestre, ".csv")), row.names = FALSE)
#
# operazioni <- read_csv2(file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), guess_max = 1000000)
# appo <- operazioni %>%
# mutate(OC_FLAG_VISUALIZZAZIONE = if_else(COD_LOCALE_PROGETTO == "6IGRUEI629_73366", 0, OC_FLAG_VISUALIZZAZIONE))
# write.csv2(appo, file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), row.names = FALSE)
# MEMO:
# una parte del problema è direttrici ferroviarie e giustizia civile
# patch operazioni in "2014IT16M2OP002:::2016PATTIPUG" senza FONDO_COMUNITARIO
# chk <- operazioni %>%
# filter(is.na(x_AMBITO))
# chk %>% count(FONDO_COMUNITARIO, OC_CODICE_PROGRAMMA)
#
# operazioni_rev <- operazioni %>%
# mutate(x_AMBITO = case_when(OC_CODICE_PROGRAMMA == "2014IT16M2OP002" & is.na(FONDO_COMUNITARIO) ~ "FESR",
# TRUE ~ x_AMBITO))
# write.csv2(operazioni_rev, file.path(DATA, paste0("operazioni_light_", bimestre, ".csv")), row.names = FALSE)
# ----------------------------------------------------------------------------------- #
# chk
chk <- progetti %>%
count(x_CICLO, x_AMBITO, x_GRUPPO, x_PROGRAMMA, OC_CODICE_PROGRAMMA)
progetti %>%
count(x_MACROAREA, OC_MACROAREA)
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.