knitr::opts_chunk$set(echo = TRUE)

**Instruction of MetDNA (version 0.99.13)**

**Xiaotao Shen, Zhengjiang Zhu**

`r format(Sys.Date())`


问题报告

如果有任何问题出现,请点击[此处](http://shenxt.me/2017/09/09/2017-09-09-metdna-blog/)给我留言。留言要包括下面三个部分:

常见错误总结

版本日志

Version0.99.13


MetDNA处理步骤

MetDNA一共处理过程一共分为了以下几个步骤:


Ⅰ数据准备

MetDNA需要准备的数据包括一级数据peak table(csv格式),二级数据(mgf格式或者msp)和样品信息sample.info(csv格式)。点击下载[正离子demo数据](http://oxr5qv74w.bkt.clouddn.com/MetDNA.demo.data.POS.rar)和[负离子demo数据](http://oxr5qv74w.bkt.clouddn.com/MetDNA.demo.data.NEG.rar)。

注意:

如果正负离子模式数据都有,最后想使用正负离子模式的鉴定结果进行pathway分析,那么需要保证正负离子模式的样品名称保持一致,也就是同一个样品在正负离子模式数据中一样

Table 1: demo数据信息

组别 | 个数 | 含义 --------------- | ------------- | ------------ QC | 8 | QC W03 | 10 | 野生型3天 W30 | 10 | 野生型30天 E03 | 10 | 突变型E3天 E30 | 10 | 突变型E30天 P03 | 10 | 突变型P3天 P30 | 10 | 突变型P30天

1. 一级数据(data.csv)

一级数据可以是使用XCMS,MZmine,MS-DIAL或者其他软件处理之后的数据。第一列必须为代谢物峰的名字,"name",第二列为"mz",第三列为保留时间(RT),且单位必须为秒,其他为样品的峰强度,除此之外不需要其他任何信息,**且前三列命名必须为"name","mz", "rt"**。

**Figure 1: 一级数据peak table格式示例**

2. 二级数据

二级质谱原始数据可以是使用样品采集的DDA,DIA或者targeted MS/MS数据。对于DDA数据来说,也可以是分段采集的二级数据。对于DDA和targeted MS/MS数据来说,需要将质谱原始二级数据使用ProteoWizard软件转为mgf格式,转换时参数设置参考下图。对于DIA数据来说,可以使用MS-DIAL处理之后,将其输出的msp格式文件直接拿来使用。

**Figure 2: ProteoWizard参数设置**

3. 样品信息(sample.info)

样品信息是样品的分组信息。第一列是样品名,命名为,"sample.name",第二列是样品的分组信息,命名为,"group"。样品信息为csv文件,命名为sample.info.csv。

**Figure 3:样品信息示例**


Ⅱ 数据整理

如果是正离子数据,请建立一个新的文件夹,可以随意命名,如"POS",如果是负离子数据,请建立一个新的文件夹,可以随意命名,如"NEG",然后将一级数据**(可以随意命名,如data.csv)**,二级数据(mgf或者msp格式)和样品信息**(可以随意命名,如sample.info.csv)**放置于正离子或者负离子文件夹下。并将正离子数据和负离子数据的上一级路径,设置为工作路径。现在*MetDNA*部署在小服务器上,因此需要将数据放在小服务器中**(注意是labdata文件夹)**。

**Figure 4: 将所需数据放置在文件夹中**


Ⅲ 数据处理

所有的步骤可以使用一个函数*MetDNA*全部完成。

设置工作路径并加载MetDNA

#设置工作路径并加载MetDNA
setwd("/mnt/data/samba/labdata/workreport/Shen Xiaotao/demo/fly")
library(MetDNA)

运行MetDNA处理数据。

MetDNA(ms1.data.pos = "data.csv",
       ms1.data.neg = "data.csv",
       sample.info.pos = "sample.info.csv",
       sample.info.neg = "sample.info.csv",
       pos.path = "/mnt/data/samba/labdata/workreport/Shen Xiaotao/demo/fly/POS",
       neg.path = "/mnt/data/samba/labdata/workreport/Shen Xiaotao/demo/fly/NEG",
       polarity = "positive",
       column = "hilic",
       ce = "30",
       use.default.md = TRUE,
       group = c("W03", "W30"),
       uni.test = "t",
       correct = TRUE,
       p.cutoff = 0.01,
       species = "dme",
       dn.analysis = FALSE,
       pathway.enrichment = TRUE)

参数含义如下:

注意:


Ⅳ 运行结果

*MetDNA*函数运行结束之后,所有的运行结果都存放在设置的路径中,包含二级谱图匹配鉴定结果,MRN注释结果,dysregulated network分析结果,pathway enrichment结果以及分析报告。如图5所示。[点击此处观察分析结果结构图](https://www.processon.com/view/link/59e71c36e4b040dc8507df21)。

**Figure 5: 运行结果**

1 MetDNA.parameters.csv

记录此次运行所使用的参数。

2 MS2_match_result (二级谱图匹配结果)

3 MRN_annotation_result (基于metabolic reacion network注释结果)

**Figure 6: MRN annotation result**

MRN.annotation.result.csv其中的一些列的含义:

4 Dysregulated_network_analysis_result

1) volcano.plot是选取差异代谢物峰的火山图。每个代谢物峰的p值和fold change值可以从DNA.module.annotation.result.pos.csv中得到,或者在intermediate_data文件夹中有两个R文件,分别是p.value和fold.change。

2) DNA.module.annotation.result.pos.csv是通过dysregulated modules对注释结果进行筛选以及KEGG database注释之后的注释结果。其中每列的含义可以参考**MRN.annotation.result.csv**的说明。

3) DNA_module_information:module的一些结果,该文件夹结果暂时用不到,可以不看。

4) DNA_function_annotation:紊乱网络的定性分析和定量分析结果。具体内容如下:

**Figure 7: MRN annotation result**

5 Pathway_enrichment_analysis_result

1) volcano.plot是选取差异代谢物峰的火山图。

2) Pathway.enrichment.analysis.csv是使用差异代谢物峰对应的注释直接进行通路富集分析得到的富集结果。

3) Pathway.enrichment.MSEA.pdf是pathway富集分析的结果。

4) Pathway.enrichment.overview.pdf是pathway富集分析的结果的展示。

4) Pathway.heatmap.pdf是pathway定量结果的热图展示。

5) Boxplot文件夹:是每个通路的定量box plot展示。

6) Heatmap文件夹:是每个通路的定量heat map展示。

7) Quantitative_information:pathway的定量信息,以及每个代谢物对应的peak的信息。

6 Analysis_report

对数据处理分析结果的总结。输出的结果存放在Analysis_report文件夹内。包括一份html格式的分析报告



ZhuMSLab/MetDNA documentation built on March 29, 2022, 5:45 p.m.