一、 全基因组甲基化测序概述
全基因组甲基化测序结合了亚硫酸氢盐转化(bisulfite conversion)方法与新一代高通量测序技术,可在单碱基分辨率水平上高效地检测全基因组DNA甲基化状态。亚硫酸氢盐处理可以使DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,PCR扩增所需片段,则尿嘧啶全部转化成胸腺嘧啶。对 PCR产物进行高通量测序,与参考序列比对,即可判断CpG/CHG/CHH位点是否发生甲基化。
二、 全基因组甲基化测序研究内容
全基因组甲基化图谱(DNA methylation profiling)及单样品高低甲基化位点在基因组不同区域的分布:全基因组甲基化测序可全面、精确地检测全基因组DNA甲基化状态,为更深入的表观遗传调控分析奠定基础。在全基因组甲基化图谱的基础上,对基因组不同染色体、不同基因区域、不同序列环境、不同基因功能元件如启动子、外显子、内含子、UTR区的胞嘧啶甲基化状态进行分析,有助于从多个角度研究基因的功能及调控。
研究流程示例
多样品间的差异性甲基化区域(DMR)分析:全基因组甲基化测序不但可使研究者在基因组规模洞察不同生物之间在DNA 甲基化水平和模式上的差异, 也可用于研究同一物种多个样品间的差异性甲基化区域(differentially methylated regions DMRs)。
基因组的甲基化状态具有一定的时空特异性。对某一物种,不同的环境、不同的发育阶段、不同类型的样品(细胞、组织、个体)所反映的甲基化状态可能是不同的,存在着差异性甲基化区域。其中有些是与基因调控有关的功能区域。鉴定、分析这些区域及其所在的基因或CpG岛,对发育和肿瘤等生命过程研究有一定意义。
研究流程示例
三、 全基因组甲基化测序实验技术路线
全基因组甲基化测序实验流程
四、 全基因组甲基化测序样品要求(基因组DNA)
样品纯度:OD 260/280值应在1.8~2.0 之间; RNA 应去除干净;
样品浓度:最低浓度不低于50ng/µl;
样品总量:每个样品总量不少于15µg;
样品溶剂:应溶解在H20或TE (pH 8.0)中;
样品运输:DNA低温运输(-20℃);在运输过程中用parafilm将管口密封好,以防出现污染。
五、全基因组甲基化测序数据分析技术路线
六、全基因组甲基化测序数据分析内容
1. 测序数据质量控制
包括:总reads数、总base数,Q20比例、Q20位点分布图、碱基分布图。
2. 测序数据预处理
包括:去除总体质量偏低的reads,将质量大于20碱基所占比例小于50%的reads去除;去除3’端质量Q低于20的碱基;去除reads中所含有的接头序列;去除长度小于20的测序片段(reads),去除含有低质量N碱基的reads。
3. 转化效率评估
使用lamda噬菌体基因组作为内参,评价BS转化效率。
4. 全基因组比对和mapping率统计
使用bismark软件将预处理后的reads比对到基因组,统计mapping率、样本整体甲基化水平,每个CpG\CHG\CHH位点的测序深度和甲基化比例。
5. CpG岛区域、启动子区域及整个基因组的覆盖及不同深度关系
6. CpG/CHG/CHH位点覆盖率、测序深度、甲基化比例和染色体分布
1) CpG/CHG/CHH位点测序深度
2) CpG/CHG/CHH位点甲基化比例
3) CpG/CHG/CHH位点染色体分布
4) 高甲基化位点(甲基化比例>70%)和低甲基化位点(甲基化比例<30%)的基因功能区分布。
5) 甲基化程度(%)对于基因的不同功能区域的分布。
6) 甲基化程度(%)对于基因本体和上下游区域的分布。
7) 甲基化程度(%)对于CpG island,shore和shelf区域的分布。
7. 差异甲基化位点和区段筛选
使用fisher检验筛选差异甲基化CpG/CHG/CHH位点和甲基化区段。
8. 基因promoter、TSS、gene body区域甲基化水平计算和筛选
根据已有基因注释,计算基因的promoter、TSS、gene body等区域的甲基化情况,并据此筛选差异甲基化的基因。
9. 差异甲基化位点或区段的CpG岛注释和基因注释
1) 差异甲基化位点或区段CpG岛分布
2) 差异甲基化位点或区段不同基因功能元件分布
3) 差异甲基化位点或区段染色体分布
10. 全基因组甲基化图谱
11. 甲基化和表达谱数据的联合分析
将甲基化数据和表达谱数据结合分析,将基因的差异甲基化和差异表达进行关联,可进行差异基因的甲基化情况聚类热图、不同基因区域甲基化和表达谱相关性计算和作图。
12. GO和KEGG等功能分析和作图
13. 客户定制分析
可根据客户的研究需求,协商定制个性化分析内容
甲基化测序应用案例
- 全基因组甲基化测序揭示蚕基因组稀疏的甲基化
昆虫的表观遗传学调控可以反映其多样的生物反应过程,本研究采用Illumina高通量亚硫酸盐测序,检测了模式生物蚕在单碱基水平的甲基化情况。保守估计,基因组中0.11%的胞嘧啶被甲基化,且可能全部存在于CG二核苷酸中。基因区域CG甲基化是非常丰富的,这可能与基因表达水平相关,同时也暗示了甲基化在基因转录中扮演了一个正面的角色。研究人员发现转录元素、启动子及核糖体DNAs低甲基化,相反,基因区域与基因座匹配的小RNAs被充分甲基化。该研究有助于我们对于昆虫表观遗传的理解。
原文:Single base–resolution methylome of the silkworm reveals a sparse epigenomic map. Nature Biotechnology.2010,28:216-20.