DNA片段测序策略
对于DNA大片段的测序需将其细分为能单独进行序列分析的小片段,目前有3种常用方法:鸟枪法、引物步查法和限制性酶切—亚克隆法。
1.鸟枪法
大分子DNA被随机地“敲碎”成许多小片段,收集这些随机小片段并将它们全部连接到合适的测序载体上;小片段测序完成后,根据重叠区计算机将小片段整合出大分子DNA序列,这就是鸟枪法(图3-4)。鸟枪法测序可以迅速获得90%左右的片段序列结果,但随后测序效率明显下降,这是因为随后测定的随机片段越来越多的是重复已测序完成的片段。因此,一般通过合成特定的寡核苷酸引物来测定剩余少量未知片段。
有3种方法可将DNA大片段切割成小片段:限制性内切酶、超声波处理和DNA酶Ⅰ降解(加Mn2+)。在使用这3种方法前,DNA的纯化非常重要,要去除载体DNA或仅由载体DNA产生的片段。
图3-4 鸟枪法测序过程
鸟枪法的优点是成本低、快速、易于自动化操作;缺点是在测序后期,大量重复测序使测序效率变低。
1995年,第一个细胞有机体——流感嗜血杆菌全基因组序列测定完成。研究者直接将全基因组DNA“敲”成1.6~2.0 kb大小的片段分别克隆,共使用了19 687个模板,进行了28 443个测序反应,组建了140个片段重叠群,测序用时3~4个月,耗费100万美元左右。这完全是用鸟枪法策略直接完成的,说明鸟枪法用于微生物基因组测序是有效的。
2.引物步查法
引物步查法是一种渐进式测序策略,也是一种最简单的测序策略。该方法适合双脱氧测序,并绕开了亚克隆小片段DNA的要求。最初的序列数据是利用载体上的引物获得的,一旦新的序列被确认,与新获得序列的3′端杂交的寡核苷酸就能合成,并能以之为引物进行下一轮的双脱氧测序。这样,从两头向中间,序列被一步步测定。
引物步查法相对较慢,因为序列仅从两头测得,每一步均需要一个测序反应(凝胶电泳)、数据分析、新引物设计和合成。这些过程至少需要几天时间,如果引物供应不畅,所需时间可能更长。该方法适合短cDNA片段测序,不适合长cDNA片段测序,同时不宜自动化处理,因为每一反应需要一个不同的引物,选用何种引物需依据上一次反应结果而定。引物步查法成本相对较高,每一步都需要合成一个新引物,这是制约该技术广泛应用的一大短板。但是,最近寡核苷酸的合成成本已显著下降,所以成本问题有望解决。引物步查法的优点在于技术简单,不需要亚克隆或其他操作,实际操作时间不多,在其测序过程中,分析者有大量时间兼顾其他事情。
引物步查法将合成一套覆盖整条序列的测序引物,如果序列需要重复测序,如测定序列突变等位点,这套引物就将成为很有用的资源。
3.限制性酶切—亚克隆法
从原理上讲,序列的信息可以从其已知的限制性内切酶位点中获得。用限制性内切酶酶切并亚克隆一个适当大小的片段,使酶切位点附近的未知片段与载体已知序列相邻,这样就可以用载体的引物去测定未知序列;可以很方便地利用2个或更多位点去切除一个未知克隆片段并用DNA聚合酶再将酶切下来的克隆产物重新接合上去。由于所选用的内切酶不可能产生黏性末端,所以正常情况下,有必要用Klenow酶或T4DNA聚合酶把它们转变为平端。该方法示意图如图3-5所示。
该方法的关键是需要一张准确的限制性内切酶谱,而且这些酶切位点间最好相隔几百个碱基。对于一个熟练的研究者来说,制作一张酶切图并不难,但是酶切位点的分布则是一个随机问题,所以,位点距离不可能总适合该方法的测序(利用该方法可以得到整条片段的大部分序列)。由于该方法基于酶切图,所以对哪些尚有缺口、缺口有多大都很清楚,这有助于进一步的分析。
该方法难以自动化,因为它依赖于一套特定的亚克隆过程,而这些过程每次的测序计划均是不同的。最常用的方法可能是利用未知片段中的少量酶切位点,作为未知片段的一个新起点,然后用引物步查法在每个方向进行测序。较单用引物步查法,这种混合法可以显著减少整个片段的测序时间。