MeDIP-Seq(Methylated DNA Immunoprecipitation Sequencing )采用甲基化DNA免疫共沉淀技术,通过5'-甲基胞嘧啶抗体特异性富集基因组上发生甲基化的DNA片段并进行高通量测序。研究者通过MeDIP Sequencing可以快速有效地寻找基因组上的甲基化区域,从而比较不同样本间DNA甲基化修饰模式的差异。此方法可以覆盖整个基因组范围的甲基化区域并且成本较低,特别适用于多样品的全基因组DNA表观遗传研究。
一、数据分析流程 
二、数据分析内容
对MeDIP-seq测序数据进行分析,包括数据预处理、基因组比对、比对结果相关统计、对于CpG岛区域、启动子区域及整个基因组的覆盖和深度、甲基化富集peak 查找、单样本peak区域在基因组不同功能区域和CpG岛区域的分布统计、多样本差异甲基化区段(DMR)筛选、差异甲基化区段在CpG岛和CpG岛岸的分布统计、差异甲基化区段在启动子和不同基因功能区的分布统计、相关注释和富集分析(基因、CpG岛、GO和KEGG等)。
1. 测序数据质量控制 包括:总reads数、总base数,Q20比例、Q20位点分布图。
2. 测序数据预处理 包括:去除总体质量偏低的reads,将质量大于20碱基所占比例小于50%的reads去除;去除3’端质量Q低于20的碱基;去除reads中所含有的接头序列;去除长度小于20的测序片段(reads)。
3. 将预处理后的reads比对到参考基因组并统计富集效率 包括:Reads唯一比对率,在CpG岛区域、启动子区域及整个基因组的覆盖及不同深度关系。 
4. Peak查找和统计 应用MACS软件对基因组mapping得到的bam文件进行peak 富集区查找,并统计长度和染色体分布。
5. Peak在CpG岛、不同基因功能元件和不同GC含量区域中的分布 Peak CpG岛分布:

Peak不同基因功能元件上的分布: 
6. 基于peak的样本间差异分析 将各样本有重叠的peak合并,统计每个样本在合并后的peak中是否富集,统计组间差异的个数并基于RPKM (Reads Per Kilobase per Million mapped reads)计算peak在组间差异是否显著。
7. 样本间差异peak区域测序深度作图

8. 对差异基因进行GO功能富集分析及pathway功能分析
GO功能分析:

KEGG功能分析: 
9. MeDIP-seq数据和表达谱数据结合分析 将MeDIP-seq数据和表达谱数据结合分析,对富集peak区域和差异表达基因进行关联。
10. 全基因组甲基化图谱 全基因组水平的甲基化水平分布:

11. 客户定制分析 可根据客户的研究需求,协商定制个性化分析内容。
|