一、高通量测序
高通量测序技术又称“下一代”测序技术,以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
高通量测序技术是对传统测序的一次革命性改变,它使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又称深度测序。
根据发展历史、影响力、测序原理和技术不同等,高通量测序可主要分为以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing,MPSS)、聚合酶克隆、454焦磷酸测序、Illumina(Solexa)sequencing、ABI SOLiD sequencing、离子半导体测序、DNA纳米球测序等。
高通量测序的实验步骤如下:
①样本准备;
②文库构建;
③测序反应;
④数据分析。
自2005年454 Life Sciences公司(2007年该公司被Roche正式收购)推出了454 FLX焦磷酸测序平台以来,曾推出过3′30xl DNA测序仪的Applied Biosystem(ABI)公司(一直占据着测序市场最大份额的公司)的领先地位就开始动摇了,因为他们的拳头产品——毛细管阵列电泳测序仪系列遇到了两个强有力的竞争对手,一个是罗氏公司的454测序仪,另一个是2006年美国Illumina公司推出的Solexa基因组分析平台。为此,2007年ABI公司推出了自主研发的SOLiD测序仪。目前,这三个测序平台即为高通量测序平台的代表。目前的主流测序平台如表3-2所示。
表3-2 主流测序平台一览
Illumina公司的新一代测序仪Hiseq 2000和Hiseq 2500具有高准确性、高通量、高灵敏度和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究。Hiseq是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时将基因组DNA的随机片段附着于光学透明的玻璃表面上,这些DNA片段经过延伸和桥式扩增后,在Flow cell上形成数以亿计的Cluster,每个Cluster都是具有数千份相同模板的单分子簇。然后利用带荧光基团的4种特殊脱氧核糖核苷酸,通过可逆性终止的SBS(边合成边测序)技术对待测的模板DNA进行测序。
测序技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行从头测序,获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序,在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序,从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序,通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。
这里需要特别指出的是,第二代测序结合微阵列技术而衍生出来的应用——目标序列捕获测序技术。这项技术首先利用微阵列技术合成大量寡核苷酸探针,这些寡核苷酸探针能够与基因组上的特定区域互补结合,从而富集到特定区段,然后用第二代测序技术对这些区段进行测序。目前提供序列捕获的厂家有Agilent和Nimblegen,应用最多的是人全外显子组捕获测序。科学家们目前认为外显子组测序比全基因组重测序更有优势,不仅费用较低,而且外显子组测序的数据分析计算量较小,与生物学表型结合更为直接。
目前,高通量测序开始广泛应用于寻找疾病的候选基因上。内梅亨大学的研究人员使用这种方法鉴定出Schinzel-Giedion综合征中的致病突变,Schinzel-Giedion综合征是一种导致严重智力缺陷、肿瘤高发以及多种先天性畸形的罕见病。他们使用Agilent SureSelect序列捕获和SOLiD对四位患者的外显子组进行测序,平均覆盖度为43倍,读长为50 nt,每个个体产生了2.7~3 GB可作图的序列数据。它们聚焦于全部4位患者都携带变异体的12个基因,最终将候选基因缩小至1个。而贝勒医学院基因组测序中心也计划对15种Science年度十大疾病突破进行研究,包括脑癌、肝癌、胰腺癌、结肠癌、卵巢癌、膀胱癌、心脏病、糖尿病、自闭症以及其他遗传疾病,以更好地理解致病突变以及突变对疾病的影响。前不久刚刚结束的评选中,外显子组测序名列其中。
以上我们盘点了2010年以来第二代测序技术的最新进展和相关应用。但是除了第二代测序之外,另外一种以单分子实时测序和纳米孔为标志的第三代测序技术也在如火如荼地发展,只是还没有正式发布。所以目前科学界所说的高通量测序指的还是第二代测序。
高通量测序技术的诞生可以说是基因组学研究领域具有里程碑意义的事件。该技术使得核酸测序的单碱基成本与第一代测序技术相比急剧下降,以人类基因组测序为例,20世纪末进行的人类基因组测序计划花费30亿美元解码了人类生命密码,而第二代测序技术使得人类基因组测序成本进入万(美)元基因组时代。如此低廉的单碱基测序成本使得我们可以实施更多物种的基因组测序计划从而解密更多生物物种的基因组遗传密码。同时在已完成基因组序列测定的物种中,对该物种的其他品种进行大规模的全基因组重测序也成了可能。