基因表达谱数据分析
产品名称: 基因表达谱数据分析
英文名称: 基因表达谱数据分析
产品编号:
产品价格: 0
产品产地: null
品牌商标: null
更新时间: null
使用范围: null
- 联系人 :
- 地址 : 北京市海淀区中关村东路1号清华大学南门外文津国际公寓1504
- 邮编 :
- 所在区域 : 北京
- 电话 : 135****3131 点击查看
- 传真 : 点击查看
- 邮箱 : service@co-fly.net
芯片质量控制(Quality control,QC) 通过对数据作图,可以评价实验数据的质量,了解数据的分布规律,从而决定下一步的分析方法。
原始数据标准化(Raw data normalization) 对原始数据进行处理,通过特定的统计分析,达到消除背景噪音,过滤脏数据,去除同一实验不同block之间、不同芯片之间的实验误差,使不同芯片的数据具有可比性。下图为数据标准化前(左图)后(右图)数据的盒图,表示各芯片数据的数值分布。
差异表达分析(DEG analysis) 差异表达分析是芯片数据的基本分析手段之一,不同方法适用于不同的数据,常用的方法有limma,SAM,T-test ,Fisher’s exact test等。
聚类分析 聚类分析可用来做疾病亚型分型(sub-classification),可用于检测样本群体分布情况,发现表达相关基因群等。常用的聚类方法有层次聚类(hierarchical cluster),K-means,自组织映射(SOM)。
基因注释 (GO/pathway annotation) 采用不同数据库对筛选出来的重要基因进行注释。
基因集富集分析 (Gene Set Enrichment Analysis, GSEA) 富集分析是基于统计学检验的case/control高通量分析方法,可用于揭示生物学样本(case相对于control)中被显著激活或显著抑制的功能。与翔自主开发研制了不同的功能分析数据库,可以提供对GO、KEGG、BioCarta、疾病相关基因、肿瘤相关基因、转录因子结合位点等功能的富集分析。