Description Usage Details Value Author(s) Examples
FastMINE通过MINE策略挖掘变量间的相关性。MINE不需要考虑变量的分布,在global health/gene expression/major-league baseball/the human gut microbiota等大数据挖掘面前有一定的优势。不过当背景噪音很强时,MINE的表现出相对较弱的相关性挖掘能力。但总体上,在相关性挖掘方面,MINE算法要优于很多传统的算法(比如Pearson法)。FastMINE()的运行依赖Java。
1 2 3 4 5 |
某些可以考虑MINE策略的特殊情况: noncoexistence relationships(非共存关系):一者存在,另一者几乎不存在。
X var/Y var |
作比较的markers pair. |
MIC (strength) |
the maximal information coefficient.MIC is general and roughly equal to R2 on functional relationships.相关性强度。MIC越高,相关性越强。与Pearson correlation是类似的。 |
MIC-p^2 (nonlinearity) |
MIC-Pearson^2,非线性程度。y=x的MIC-p^2为0。MIC-p^2值越高,相关性的非线性程度就越强。 |
MAS (non-monotonicity) |
非单调性。y=x的MAS为0。MAS越高,则非单调性越强,越难用单调函数进行相关性描述。 |
MEV (functionality) |
函数性。y=x的MEV为1,MEV越高代表函数性越强,越容易用函数进行描述。 |
MCN (complexity) |
复杂度:y=x的值为2,越高表明相关性越复杂,越难用尽量少的变量去描述它们之间的相关性。 |
Pearson(p) |
Pearson correlations |
Weibin Huang
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | library(lucky)
data=state.x77;colnames(data)
result1 <- FastMINE(data,
transposition = F,
method = "all.pairs",
control.markers="Income",
target.markers=NULL)
View(result1[["MIC.matirx"]])
result2 <- FastMINE(data,
transposition = F,
method = "one.pair",
control.markers="Income",
target.markers=NULL)
colnames(result2);View(result2)
|
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.