In mi-erasmusmc/AssociationRuleMining: What the Package Does (One Line, Title Case)

knitr::opts_chunk$set(echo = TRUE)
library(DatabaseConnector)
library(SqlRender)
library(Eunomia)
library(FeatureExtraction)
library(AssociationRuleMining)
devtools::load_all()

Connect to the database

### Define database parameters
cdmdatabaseschema = "main"
resultsdatabaseschema = "main"
fpm_inputFile = "fpm_testing.txt"
fpm_outputFile_SPAM = "fpm_testingResults_SPAM.txt"
fpm_outputFile_SPADE = "fpm_testingResults_SPADE.txt"
fpm_outputFile_prefixSpan = "fpm_testingResults_prefixSpan.txt"
fpm_outputFile_Clasp = "fpm_testingResults_Clasp.txt"
fpm_outputFile_CMClasp = "fpm_testingResults_CMClasp.txt"
fpm_outputFile_MaxSP = "fpm_testingResults_MaxSP.txt"
fpm_outputFile_VMSP = "fpm_testingResults_VMSP.txt"
fpm_outputFile_VGEN = "fpm_testingResults_VGEN.txt"
fpm_outputFile_RuleGrowth = "fpm_testingResults_RuleGrowth.txt"
fpm_outputFile_ERMiner =  "fpm_testingResults_ERMiner.txt"

connectionDetails <- Eunomia::getEunomiaConnectionDetails()
connection <- connect(connectionDetails)
#on.exit(DatabaseConnector::disconnect(connection)) #Close db connection on error or exit

Define cohort

# Define cohort
cohort <- "SELECT person_id AS subject_id,
  condition_start_date AS cohort_start_date
INTO #diagnoses
FROM @cdm.condition_occurrence
WHERE condition_concept_id IN (
    SELECT descendant_concept_id
    FROM @cdm.concept_ancestor
    WHERE ancestor_concept_id = 4329847 -- Myocardial infarction
)
  AND condition_concept_id NOT IN (
    SELECT descendant_concept_id
    FROM @cdm.concept_ancestor
    WHERE ancestor_concept_id = 314666 -- Old myocardial infarction
);
INSERT INTO @cdm.cohort (subject_id, cohort_start_date, cohort_definition_id)
SELECT subject_id,
  cohort_start_date,
  CAST (1 AS INT) AS cohort_definition_id
FROM #diagnoses
INNER JOIN @cdm.visit_occurrence
  ON subject_id = person_id
    AND cohort_start_date >= visit_start_date
    AND cohort_start_date <= visit_end_date
WHERE visit_concept_id IN (9201, 9203, 262); -- Inpatient or ER;"

renderTranslateExecuteSql(connection, cohort, cdm = cdmdatabaseschema)

sql <- "ALTER TABLE #diagnoses ADD cohort_definition_id INT NOT NULL DEFAULT(1)"

# Execute the script to receive the data
renderTranslateExecuteSql(connection, sql)

querySql(connection, "SELECT count(*) FROM diagnoses;")

Get the data and close the connection

# Define covariate settings
TemporalcovariateSettings_eunomia <- createTemporalCovariateSettings(useConditionOccurrence = TRUE,
                                                      temporalStartDays = seq(-(60*365), -1, by = 1) ,
                                                      temporalEndDays = seq(-(60*365)+1, 0, by = 1))

# Extract covariates
TemporalcovariateData_eunomia <- getDbCovariateData(connection = connection, 
                         cdmDatabaseSchema = cdmdatabaseschema, 
                         cohortDatabaseSchema = resultsdatabaseschema, 
                         cohortTable = "diagnoses", 
                         rowIdField = "subject_id", 
                         covariateSettings = TemporalcovariateSettings_eunomia, 
                         cohortTableIsTemp = TRUE)


disconnect(connection)

Frequent pattern mining

Prepare the data

testData <- getInputFileForFrequentPatterns(covariateDataObject = TemporalcovariateData_eunomia, fileToSave = fpm_inputFile)

Run SPAM

spam_frequentPatterns <- runFrequentPatterns(algorithm = "SPAM", 
                                        inputFile = fpm_inputFile, 
                                        outputFile = fpm_outputFile_SPAM, 
                                        minsup = 0.5, 
                                        showID = TRUE)
head(spam_frequentPatterns)

Run SPADE

spade_frequentPatterns <- runFrequentPatterns(algorithm = "SPADE", 
                                        inputFile = fpm_inputFile, 
                                        outputFile = fpm_outputFile_SPADE, 
                                        minsup = 0.5, 
                                        showID = TRUE)

head(spade_frequentPatterns)

Run prefixSpan

pS_frequentPatterns <- runFrequentPatterns(algorithm = "prefixSpan", 
                                        inputFile = fpm_inputFile, 
                                        outputFile = fpm_outputFile_prefixSpan, 
                                        minsup = 0.5,
                                        showID = TRUE)

head(pS_frequentPatterns)

Run Clasp

clasp_frequentPatterns <- runFrequentPatterns(algorithm = "Clasp", 
                                              inputFile = fpm_inputFile, 
                                              outputFile = fpm_outputFile_Clasp, 
                                              minsup = 0.50, 
                                              showID = TRUE )

head(clasp_frequentPatterns)

Run CM-Clasp

cmclasp_frequentPatterns <- runFrequentPatterns(algorithm = "CM-Clasp", 
                                              inputFile = fpm_inputFile, 
                                              outputFile = fpm_outputFile_CMClasp, 
                                              minsup = 0.50, 
                                              showID = TRUE )

head(cmclasp_frequentPatterns)

Run VMSP

vmsp_frequentPatterns <- runFrequentPatterns(algorithm = "VMSP", 
                                              inputFile = fpm_inputFile, 
                                              outputFile = fpm_outputFile_VMSP, 
                                              minsup = 0.50, 
                                              showID = TRUE )

head(vmsp_frequentPatterns)

Run VGEN

vgen_frequentPatterns <- runFrequentPatterns(algorithm = "VGEN", 
                                              inputFile = fpm_inputFile, 
                                              outputFile = fpm_outputFile_VGEN, 
                                              minsup = 0.50, 
                                              showID = TRUE )

head(vgen_frequentPatterns)

Run RuleGrowth

ruleGrowth_frequentPatterns <- runFrequentPatterns(algorithm = "RuleGrowth", 
                                              inputFile = fpm_inputFile, 
                                              outputFile = fpm_outputFile_RuleGrowth, 
                                              minsup = 0.50, 
                                              minconf = 0.50,
                                              showID = FALSE #Does not retrieve IDs
                                              )

head(ruleGrowth_frequentPatterns)

Run RuleGrowth

erminer_frequentPatterns <- runFrequentPatterns(algorithm = "ERMiner", 
                                              inputFile = fpm_inputFile, 
                                              outputFile = fpm_outputFile_ERMiner, 
                                              minsup = 0.50,
                                              minconf = 0.5, 
                                              showID = TRUE #Does not retrieve IDs
                                              )

head(erminer_frequentPatterns)

mi-erasmusmc/AssociationRuleMining documentation built on Oct. 26, 2021, 1:31 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

mi-erasmusmc/AssociationRuleMining
What the Package Does (One Line, Title Case)

In mi-erasmusmc/AssociationRuleMining: What the Package Does (One Line, Title Case)

Connect to the database

Define cohort

Get the data and close the connection

Frequent pattern mining

Prepare the data

Run SPAM

Run SPADE

Run prefixSpan

Run Clasp

Run CM-Clasp

Run VMSP

Run VGEN

Run RuleGrowth

Run RuleGrowth

R Package Documentation

Browse R Packages

We want your feedback!

mi-erasmusmc/AssociationRuleMining What the Package Does (One Line, Title Case)

In mi-erasmusmc/AssociationRuleMining: What the Package Does (One Line, Title Case)

Connect to the database

Define cohort

Get the data and close the connection

Frequent pattern mining

Prepare the data

Run SPAM

Run SPADE

Run prefixSpan

Run Clasp

Run CM-Clasp

Run VMSP

Run VGEN

Run RuleGrowth

Run RuleGrowth

R Package Documentation

Browse R Packages

We want your feedback!

mi-erasmusmc/AssociationRuleMining
What the Package Does (One Line, Title Case)