基因克隆的主要方法
目的基因是指要研究其生物学功能的一段编码特定蛋白的DNA 序列。在基因克隆中,首先需要利用分子生物学技术,将目的基因从染色体上分离出来,获得基因序列并构建到载体上。一般来讲,基因克隆的策略可分为两种途径:正向遗传学途径和反向遗传学途径。正向遗传学途径以克隆的基因所表现的功能为基础,通过基因的表达产物或表型性状鉴定进行克隆,如功能克隆和表型克隆等;反向遗传学途径则是着眼于基因本身特定的序列或者在基因组中的特定位置进行克隆,如定位克隆、同源序列法克隆等;随着DNA测序技术和生物信息学的进一步发展,又产生了电子克隆等新兴克隆技术。简单地说,正向遗传学是从表型变化到基因变化,而反向遗传学则是从基因变化研究表型变化。目前,在农业生物技术领域,已经从玉米、水稻、油菜、小麦、拟南芥、烟草、番茄等多种植物与动物及微生物中克隆得到了许多与植物的产量、品质、抗性及农艺性状等相关的基因。
1.功能克隆
利用蛋白质的表达和功能信息分离鉴定出未知基因的方法称为未知基因的功能克隆(functional cloning)。功能克隆法是根据性状的基本生化特征,鉴定已知基因的功能后分离目标基因的一种方法,该法是人类采用的第一个基因克隆策略。其基本过程为:分离纯化感兴趣的蛋白质并测定部分氨基酸序列,设计相应的抗体待用;分离可能含有该蛋白的组织,提取RNA 和mRNA 进行体外翻译,在蛋白合成过程中,加入已制备的抗体,此时正在合成的该蛋白连同其模板mRNA 一同被沉淀;用蛋白酶消化沉淀中的蛋白质得到mRNA,进行反转录得到cDNA,进行测序获得要克隆的基因编码序列。如果用功能克隆同源基因,其基本过程为:根据已知序列制备核苷酸探针或者蛋白抗体,杂交筛选cDNA文库或基因组文库,或者使用相应蛋白的抗体探针,筛选表达载体构建的cDNA 文库获得相应克隆,对选中的克隆进行测序,获得目的基因序列。功能克隆的关键在于需要先分离出纯度高的蛋白质,测定其部分氨基酸序列或得到相应抗体;其次构建cDNA 文库或者基因组文库。
由于在不同发育阶段、不同环境条件、不同细胞类型内蛋白质种类不完全相同,所以在定位克隆产生之前运用功能克隆所获得的基因相对较少。但是由于功能克隆技术成熟、方法直接、费用较低,其在基因克隆中仍发挥着重要作用。王春香等从感病的烟草叶片中分离得到了马铃薯X 病毒(PVX),克隆了马铃薯X 病毒外壳蛋白基因,并将这个基因转到马铃薯中,以获得抗PVX 的马铃薯栽培种。Li L G 等通过功能克隆的方法,从拟南芥中克隆到一个解毒外运载体蛋白基因AtDTX1,并发现了一个包括至少56 个相关蛋白的基因家族。舒群芳等构建天麻cDNA 文库,用纯化的蛋白质探针免疫筛选,克隆获得了天马抗真菌的cDNA,为农业抗真菌工程打下了基础。
2.图位克隆
图位克隆(map-based cloning),又称定位克隆,是由剑桥大学的Alan Coulson 于1986年首先提出,该方法是根据目标基因在染色体上的位置进行基因克隆,既不需要预先知道基因的DNA 序列,也无需先知道其表达产物的相关信息。其基本思路为:1)根据功能基因在基因组中具有相对稳定的基因座,首先利用分子标记技术将目的基因精确定位在分子标记连锁图上;2)用与目的基因两侧紧密连锁的标记筛选大片段DNA 文库(如YAC 、BAC、TAC、PAC 或cosmid 文库),并构建含目的基因区域的精细物理图谱;3)利用该物理图谱采用染色体步行(chromosome walking)的方法逐步逼近候选区域,若侧翼标记与目的基因连锁十分紧或共分离,无须步移就可直接通过染色体登录的方法,获得含目的基因的大片段克隆;4)将大片段克隆做亚克隆分析或以大片段克隆做探针筛选cDNA 文库,从而将目的基因确定于一个较小的DNA 片段上;5)进一步做序列分析,通过遗传转化和功能互补分析,鉴定所获得的目的基因。
图位克隆首先是在分离动物基因上获得成功,后来利用此技术在植物拟南芥中克隆得到ABI3基因和FAD3基因。后来,植物中运用图位克隆技术,从拟南芥、水稻、番茄、大麦、小麦、甜菜、马铃薯等植物中分离了几十个重要的基因,并以抗病基因的克隆居多,如番茄的Mi 基因、Pto 基因、Hero 基因,马铃薯的Gpa2 基因,拟南芥的RPW8 基因、PBS1 基因、Rpp13 基因,水稻的Ghd7、RIDI、Pib等基因。近年来张启发领导的“基因组研究与水稻遗传改良”国家创新团队利用此方法相继分离克隆出同时控制水稻株高、抽穗期和每穗粒数的基因Ghd7 和控制水稻籼粳不育和广亲和性状的主效基因S5,以及调控水稻开花时间、影响其生长周期的RID1基因,使水稻功能基因组研究领域取得重大突破。
理论上讲,图位克隆适用于一切基因,但是由于图位克隆依赖于高密度的分子标记连锁图谱,其对基因组大而且重复性多,又难于构建高密度分子标记连锁图谱的小麦、玉米等植物来说,要相对困难得多。但是随着基因组学的发展,人们开始利用图谱饱和的生物学信息服务于其他生物,可以利用同科异种间染色体共线性或同线性进行比较作图。这些进展不但为图位克隆创造了条件,也扩展了图位克隆的应用范围。
3.转座子标签法
目前研究发现,可移位遗传因子是核基因组的重要组成部分,大致可分为两类:转座子和反转录转座子。转座子(transposon)是可以从染色体的一个位置转移到另一个位置的DNA 片段,最先在玉米中被发现,后来研究表明,转座子在基因组中普遍存在,且在生物功能基因的克隆、遗传调控、新型功能基因的发生、生物系统发育与进化等方面具有重要作用。反转录转座子的移位是染色体基因组上的一段DNA,经转录成RNA,再反转录成DNA,从而移位到基因组的另一位置。
转座子可以在染色体上随机地转移位置,且在转座过程中原位置的DNA 片段并未消失,发生转移的只是转座子的拷贝,它也可以从染色体的插入部位切离。当转座子随机插入到染色体的基因组中导致基因结构变化,导致基因失活,从而产生突变基因型,而当转座子切除时,失活的目的基因又恢复活性。转座子标记法(transposon tagging)克隆基因是基于转座子序列的特点而进行的,当转座子插入导致基因失活或突变时,实际上就是给目的基因标记了序列已知的标签。转座子标签法的基本过程:首先将转座子和抗性筛选基因连接构建到质粒载体上,通过有效的转化途径转化目标植株,筛选阳性植株并自交获得双隐性突变个体,分析获得不同的突变转基因株系,最后分离与突变有关的目的基因。目前,在植物中利用的转座子有玉米的Ac/Ds、En/Spm 及金鱼草的Tam3等,其中Ac/Ds应用最为广泛。
转座子标签法是挖掘、克隆未知基因的有效方法之一,其优点有:
(1)由转座子插入引起的突变会随着转座子的切离而恢复;
(2)转座子在染色体上的位置一旦确定,与其连锁的突变基因的相对位置就很容易被确定;
(3)转座子导入目标植物,可以得到较大的含不同插入位点的转座子群体;
(4)转座子异源导入不受转化条件限制。
目前,利用转座子标签法分离到植物未知功能基因的报道较多。利用转座子标签法克隆到的第一个基因是玉米的brone 基因。Johal 和Bridgs 利用此法克隆到玉米的抗圆斑病基因HML。另外,番茄中的抗叶霉病的Cf-9 基因、亚麻抗锈病基因L6、烟草抗花叶病毒基因等都是用此方法克隆获得的。
4.差异表达基因克隆技术
高等真核生物所有生命过程,都会通过基因表达的质和量体现出来,因此分离和克隆相关基因是了解生命活动的基础。早期人们开发出差别筛选技术和扣除杂交技术,但是由于它们灵敏度低、成本高等缺点,现已逐步被淘汰。在此基础上,人们又先后建立起mRNA 差异显示法(DDRT-PCR)、代表性差异分析法(RDA)及抑制性扣除杂交(SSH)等方法,同时,cDNA微阵列和基因芯片技术也应运而生。(https://www.daowen.com)
差异表达基因克隆技术的方法比较多,但它们都有自己的独特的优点和局限性,将不同的方法有效地结合起来,将会更具有价值。目前,通过运用差异表达基因分离技术的各种方法,已经鉴定、克隆出JPRXY1、DLM-1及CLUL1等基因。
5.同源序列法
随着对基因认识的深入,人们发现在基因组中存在很多具有高度同源区域的基因,这些基因可以构成一个基因家族。同源克隆就是根据基因家族成员间具有保守氨基酸序列,设计简并引物,利用该引物对目的基因的cDNA 文库或DNA文库进行扩增,对产物进行分离鉴定和功能分析,以此获得目的基因;或者根据保守域的序列设计并合成探针,然后从cDNA文库或者基因组文库中筛选到目的基因的克隆
同源序列法提出后,引起学者的广泛重视,利用该法已经从水稻、小麦、拟南芥、番茄、大豆、烟草中分离到许多与已知基因同源的序列。张晓国等以水稻总DNA 为模板,扩增得到水稻的花药特异表达基因的启动子Osg6B。Santy等通过设计简并引物,从野生抗病香蕉中扩增得到了5类NBS序列,并利用RT-PCR进行了表达分析。
虽然此方法简便快速,但以下问题值得注意:
(1)由于密码子的简并性和同源序列间同源程度的差异,简并引物需要优化,特异性要设计得当。
(2)由于某些同源序列并不专属于某一基因家族,因而扩增的同源序列不一定属于某一基因家族成员。
(3)基因家族成员往往是成簇存在的,克隆得到的基因片段是否为目的基因需要进一步判断。因此,获得的克隆产物,有必要进行基因与性状共分离分析,插入失活或遗传转化等功能鉴定和验证基因。
6.电子克隆
电子克隆(electronic cloning),又称芯片克隆或网上克隆,是以计算机和互联网为工具,数学算法为手段,利用生物信息学方法,依托现有的网络资源,通过表达序列标签或基因组的编码序列组装与拼接,发掘新的基因。目前,随着生物信息数据库的不断完善,电子克隆已是克隆新基因的主要手段之一。
电子克隆基因的主要步骤是:
(1)用感兴趣的基因或同源的EST为查询序列,采用Blast在对应的EST数据库进行同源性检索,获得与起始查询序列有重叠的片段(重叠40 个碱基范围内超过95%以上同源性)或同源性高的ESTs(同源性50%~80%的长度大于100 bp);
(2)聚类分析,除去旁系同源基因,将剩余检出序列拼接组装为序列重叠群;
(3)以上一步骤获得的重叠群再次进行Blast 检索,重复进行上述两步过程,直到没有更多的EST检出或者重叠群序列不能再获得延伸;
(4)PCR扩增获得拼接片段,继续步移,获得候选基因的全长cDNA序列;
(5)将获得的cDNA 序列与核酸数据库进行相似性检索,检测所得的序列是已知基因还是未鉴定新基因或未知基因;
(6)新基因和未知基因的生物学功能研究及基因注册。
与传统基因克隆相比,电子克隆具有速度快、投入低、技术要求低和针对性强等优点。黄骥等用来源于水稻盐胁迫cDNA 文库中的ESTS121 为探针,搜索水稻EST 库,发现了2 个EST 序列与ESTS121 序列有部分一致,经拼接获得一个886 bp 的cDNA 全长序列,并克隆得到QsZFP基因。孔令娜基于电子克隆技术,从甘蓝型油菜中得到一个新的逆向转运蛋白基因cDNA序列,该序列全长1593 bp,编码530个氨基酸,被命名为BnNHX6。