5.3.2 基因组文库的质量评价
基因组文库必须包括一定数量的重组子才可能克隆基因组中的任何序列。基因组文库完备性是指从基因组文库中筛选出含有某一目的基因的重组克隆的概率。如果满足两个条件:生物体染色体DNA片段被全部克隆,用于构建基因文库的DNA片段含有完整的基因,则此基因文库的完备性就是100%。通常用基因组文库的克隆数来表示基因组文库的大小,即库容量。
1.理论值
基因组文库的克隆数(N)=基因组DNA总长/DNA插入片段的平均长度
例如,某种生物基因组DNA总长度为3×106 kb,酶切后的DNA片段平均长度为15 kb,则基因组文库的克隆数应为3×106 kb/15 kb=2×105。在实际工作中,由于在基因组文库的构建过程中存在多步操作,一个具备完好代表性的基因组文库的库容量大大超过这个理论值。
2.经验值
1976年,Clarke-Carbon提出一个经验公式,用来计算基因组文库应有的克隆数(N),即
N=ln(1—P)/ln(1—f/g)
式中:P为从基因文库中选出任一基因或DNA序列的概率,即完备性,一般设为99%(0.99);f为载体容量(kb);g为基因组大小(kb);N为基因组文库的克隆总数,表示文库中以P概率出现某段DNA理论上应具有的最小克隆数。
根据公式可以计算某一基因组文库中应该包含的克隆数,也就是满足最低要求的基因组文库的库容量。例如:人的单倍体DNA总长为3×109bp,若载体装载量为15 kb,则构建一个完备性为0.9的基因组文库大约需要4.6×105个重组克隆。当完备性分别提高到0.99、0.999和0.9999时,基因组文库库容量分别需要达到9.2×105、1.38×106和1.84×106个克隆,即为保证某一基因有99.99%的概率至少被克隆一次,需要构建含有1.84×106个不同重组子的基因组文库。
基因组文库应具有的克隆数与基因组大小、载体容纳外源片段大小(载体容量)的关系见表5-1(假设文库中出现任一基因或序列概率为99%)。
表5-1 几种典型生物基因组文库克隆数与基因组大小、载体容量的关系

续表

选择载体的主要参数是基因组大小。例如,构建大肠杆菌(4.6×106kb)等基因组较小生物的基因组文库时,按每个DNA片段平均长5 kb计算,一个包括5000个DNA片段克隆的基因文库就能够代表一个完整的大肠杆菌基因组序列,采用质粒作为载体便可得到满意的结果。构建较大基因组的文库时,噬菌体、黏粒以及YAC常选作克隆载体。根据所选用的载体,基因组文库可以分为质粒文库、噬菌体文库、黏粒文库、人工染色体文库(细菌人工染色体文库、酵母人工染色体文库等)。
3.一个理想的基因组DNA文库应具备的条件
一个理想的基因组DNA文库应具备以下条件:
(1)尽可能高的完备性,重组克隆总数不宜过大,以减轻筛选工作量;
(2)载体装载量最好大于绝大多数基因的长度,避免基因被分隔克隆;
(3)克隆与克隆之间必须存在足够长度的重叠区域,以利于克隆排序;
(4)克隆片段易于从载体分子上完整卸下;
(5)重组克隆能稳定保存、扩增及筛选。