2016年5月,第三代最新测序平台PacBio Sequel入驻贝瑞和康,随后贝瑞和康开发出基于三代测序平台的长片段目标区域测序,并展示了Sequel首批运行数据(在文稿国内首批:PacBio Sequel数据新鲜出炉已展示)。近日PacBio推出最新Sequel V1.1试剂,贝瑞和康基于全长转录组测序策略,独家对2-3Kb、3-6Kb大片段文库上机测试。今天,小编将再次挽手各位科研咖一起领略Sequel数据表现。
全长转录组概述
全长转录组测序技术基于第三代PacBio平台长度长的优势,无需拼接组装,直接完成从5’端到3’端的序列读取,克服了无参考基因组物种转录本拼接较短、信息不完整的难题,完善复杂区域的转录组信息。
测试实验方法
样本:大鼠RNA
文库:2-3Kb、3-6Kb大片段文库
上机:每个文库分别上机一个cell
下机数据
PacBio Sequel平台自带Pacbio SMRTlink 3.1系统,该系统可直接统计下机数据质量。为了让各位科研咖更直观的了解Sequel平台,小编将此次测试的两个cell的下机数据质量拷贝下来展示给大家。
数据质量结果显示每个cell产出在2.5G左右,读长在4.5K左右,ZMW孔中loading一条DNA链的比例在75%左右,表明75%左右的ZMW孔为有效孔。
注:Productivity (P1):只loading一条链的ZMW孔占总孔数比例
Subreads统计
Subreads是指过滤掉接头、片段长度短于 50bp、准确度低于 0.75 的序列。依据subreads长度分布图肩峰位置可以判断文库insert是否被完全读取,Iso-seq文库构建过程中是否获得全长转录本。小编对应着每个cell 的subreads读长统计结果和文库质量给大家进行展示,方便大家进一步了解Sequel的数据产出。
2-3Kb文库
图a1 2-3k 文库质量
图a2 2-3k subreads统计结果
1、贝瑞和康在文库构建过程中,经过Bluepippin的精细片段选择,最大限度地去除了小片段污染,有效提高全长转录本比例。2-3Kb文库质检结果显示主峰在2738 bp,DNA片段长度在2028 bp - 3947 bp之间
2、2-3kb subreads统计结果显示肩峰在2Kb左右
3、文库最小片段与肩峰位置基本一致,表明肩峰右侧为ZMW孔中reads被完全读完的序列,肩峰左侧为ZMW孔中由于酶失活而导致没有读完的序列
4、肩峰左侧占比较小,酶失活比例小,subreads统计占比高
3-6Kb文库
图b1 3-6k 文库质量
图b2 3-6k subreads统计结果
1、3-6Kb文库质检结果显示主峰在4005 bp,DNA片段长度在2894 bp - 5940 bp之间
2、3-6Kbsubreads统计结果显示肩峰在2.9Kb左右
3、文库最小片段与肩峰位置基本一致,表明肩峰右侧为ZMW孔中reads被完全读完的序列,肩峰左侧为ZMW孔中由于酶失活而导致没有读完的序列
4、肩峰左侧占比较大,酶失活比例大,subreads统计占比较低
今天小编的展示到此就结束了,但这并不意味着我们的测试工作就此结束。未来,贝瑞和康会继续对第三代PacBio Sequel测序技术进行调试,将数据产出不断的进行完善,我们同时还会更新不同产品最真实的测试结果,努力将第三代PacBio Sequel测序技术完美的服务于科研工作者。