observedVersusExpected: calculate mutual information between a categorical value (X)...
In terminological/tidy-info-stats: Functions for manipulating information statistics

observedVersusExpected

R Documentation

calculate mutual information between a categorical value (X) and its absence in a data set.

Description

This calculates the mutual information of a feature not being present in all samples

Usage

observedVersusExpected(
  df,
  discreteVars,
  sampleVars,
  sampleCount = NULL,
  sampleCountDf = NULL,
  ...
)

Arguments

`df`	- may be grouped, in which case the value is interpreted as different types of variable (features)
`discreteVars`	- the column(s) of the categorical value (X) quoted by vars(...) (e.g. outcome)
`sampleVars`	- the column(s) of the sample identifier
`sampleCount`	- an integer containing the count of all samples per outcome (discreteVars)
`sampleCountDf`	- a dataframe containing columns for df grouping (features), and discreteVars (outcomes), N and N_x columns with expected counts of outcomes see expectSamplesByOutcome(...)

Details

This is relevant for sparse data sets with many features such as NLP terms, where a term as a feture may not be present in a given document, and this absense may be assymetrically distributed between different classes.

Value

a dataframe containing the distinct values of the groups of df, and for each group a mutual information column (I). If df was not grouped this will be a single entry

terminological/tidy-info-stats documentation built on Nov. 19, 2022, 11:23 p.m.

terminological/tidy-info-stats index

README.md

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

terminological/tidy-info-stats
Functions for manipulating information statistics

observedVersusExpected: calculate mutual information between a categorical value (X)...
In terminological/tidy-info-stats: Functions for manipulating information statistics

calculate mutual information between a categorical value (X) and its absence in a data set.

Description

Usage

Arguments

Details

Value

Related to observedVersusExpected in terminological/tidy-info-stats...

R Package Documentation

Browse R Packages

We want your feedback!

terminological/tidy-info-stats Functions for manipulating information statistics

observedVersusExpected: calculate mutual information between a categorical value (X)... In terminological/tidy-info-stats: Functions for manipulating information statistics

calculate mutual information between a categorical value (X) and its absence in a data set.

Description

Usage

Arguments

Details

Value

Related to observedVersusExpected in terminological/tidy-info-stats...

R Package Documentation

Browse R Packages

We want your feedback!

terminological/tidy-info-stats
Functions for manipulating information statistics

observedVersusExpected: calculate mutual information between a categorical value (X)...
In terminological/tidy-info-stats: Functions for manipulating information statistics