App GA-03 元分析 Meta-Analysis(GWAS全基因组关联分析)
产品名称: App GA-03 元分析 Meta-Analysis(GWAS全基因组关联分析)
英文名称:
产品编号:
产品价格: 0
产品产地: null
品牌商标: null
更新时间: null
使用范围: null
- 联系人 :
- 地址 : 上海市宜山路1618号新意城A1101A
- 邮编 :
- 所在区域 : 上海
- 电话 : 180-1908-2932 点击查看
- 传真 : 点击查看
- 邮箱 : service@biogenius.cn
App GA-03 元分析 Meta-Analysis
基于GWAS多阶段研究或独立研究可采用荟萃分析进行统计量的综合,计算推导疾病关联的新位点。Meta方法的不同主要在于结合统计量和统计假设的不同。根据结合统计量的不同可将Meta分析方法主要分为三类:第一类的综合统计量为效应值,它适合于测量结果为连续数据的独立研究,目前主要应用于社会科学(教育学、心理学等)、临床医学和生态学中,它可反映一个程序或现象的效应大小和方向。第二类主要应用于流行病学、病因学、大众健康学等医学领域中,综合统计量为相对风险度或风险度比或风险度差。第三类为80年代末在医学领域中发展出的回归方法,其结合统计量为药量-反应斜率,由回归方法得出的,它适合于测量结果为分类数据的独立研究。根据统计假设的不同可将Meta分析方法分为两类:固定效应模型和随机效应模型,前者假设所有研究享有共同的真实效应大小,后者假设所有研究的真实效应大小不同,具体体现在计算所有研究平均效应的权重上。由于随机效应模型比较符合实际,得到了Meta分析家们的认可,正被广泛应用开来。
- 固定效应模型( fixed effects model )应用前提是假定全部研究结果的方向与效应大小基本相同,即各独立研究的结果趋于一致,一致性检验差异无显著性。因此固定效应模型适用于各独立研究间无差异,或差异较小的研究。
- 随机效应模型 (random effects models) 是经典的线性模型的一种推广,就是把原来(固定)的回归系数看作是随机变量,一般都是假设是来自正态分布。
- 混合模型( mixed models )模型里一部分系数是随机的,另外一些是固定的,一般就叫做混合模型(mixed models)。
图例 meta-analysis 荟萃分析
---------------------------------------------------------------------------------------------------------
GWAS全基因组关联分析
Genome-Wide Association Anlaysis
全基因组关联分析(Genome Wide Association Study,GWAS)是一种发现常见疾病易感基因的有效方法,2007年被《科学》杂志评为世界十大科学进展之首。全基因组关联分析作为一个重要的疾病分析手段,主要是通过在大量人群中发现染色体上导致不同类型疾病的关键区域,这些区域往往包含了引起这些疾病的遗传变异(genetic variant)。
全基因组关联研究(Genome-Wide Association Studies,GWAS)是指通过对大规模的群体DNA样本进行全基因组高密度遗传标记(如SNP或CNV等)分型,从而寻找与复杂疾病相关的遗传因素的研究方法。GWAS在全基因组层面上,开展多中心、大样本、反复验证的基因与疾病的关联研究,全面揭示疾病发生、发展与治疗相关的遗传基因,为全面系统研究复杂疾病的遗传因素提供崭新快速的研究策略,为我们了解人类复杂疾病的发病机制提供了更多的线索。与以往的候选基因关联分析策略明显不同的是,GWAS不再需要在研究之前构建任何假设,即不需要预先依据那些尚未充分阐明的生物学基础来假设某些特定的基因或位点与疾病的关联。目前,科学家已经在阿尔茨海默、乳腺癌、糖尿病、冠心病、肺癌、前列腺癌、肥胖、胃癌等一系列复杂疾病中进行了GWAS并找到疾病相关的易感基因。我国科学家也在银屑病、精神病和冠心病等方面开展了GWAS研究并取得成效。
图例:目前已经公布的国际GWAS项目和显著性SNP位点结果 (p<=5*10-6)
在遗传流行病学中,全基因组关联研究(GWAS)是一种检测基因组上的遗传变异(genetic variant)与特定的疾病或者性状是否存在遗传性的关联。如果某个遗传变异在患病人群中出现的频率明显高于其他的遗传变异,则认为该变异与疾病有关联。因此该变异所在的染色体区域则被认为是引起疾病或者性状的原因。GWA研究并不需要对敏感等位基因所在的染色体区域有先验知识,因此通过该研究可以鉴定出许多新的未被发现的敏感基因。因此,全基因组关联研究中所检测到的遗传变异为单核苷酸多态性。
GWA研究的设计和数据分析需要多重考虑,比如样本量的问题,统计显著性水平,多重检验的校正,人口分层,遗传标记的密度,以及对独立研究结果的重复问题。
GWAS大数据分析
GWAS全基因组关联分析的主要目的是识别疾病关联的SNP位点和CNV区域,通过具有LD-关联连锁关系的SNP标记来捕获潜在的易感基因位点。在大部分GWAS研究中,我们通过tagSNP(标签SNP)来推断预测和疾病关联的位点位于何处。后续GWAS分析将针对SNP疾病易感位点进行评估和功能验证。
根据研究设计不同和研究表型的不同,采用的统计分析方法亦不同。如病例对照研究设计(质量性状),比较每个SNP的等位基因频率在病例和对照组中的差别可采用4格表的卡方检验,计算相对危险度(Odds Ratio,OR值)及其95%的可信限。此外,还需要调整主要的混杂因素,如年龄、性别等。这里采用logistic回归分析,以研究对象患病状态为因变量,以基因型和混杂因素作为自变量进行分析。我们也将针对对全基因组SNP位点进行关联分析采用 additive模型Cochran-Armitage trend test ; 全基因关联结果的Q-Q plot , 可以评估是否存在系统性的偏差。关联分析的结果可视化展示,根据LD连锁关系将多SNP与表型性状进行关联展示(如下图所示)。
图例 某基因在400kb某基因作为邻近区域SNP与疾病的关联
图例 易感基因区域的基因组定位,注释信息. 所示为在多SNP位点关联分析后呈现与表型性状关联的每个基因组上的p值尺度(-log(P) scale 纵轴)。
更多详情:http://www.biogenius.cn/htm/solution/BigData/gwas/62.html