8.2.1 酵母基因表达载体的构成

8.2.1 酵母基因表达载体的构成

酵母菌天然存在的自主复制型质粒并不多,目前用于基因表达的质粒载体是由野生型质粒和宿主染色体DNA上的自主复制子结构(ARS)、中心粒(CEN)、端粒序列(TEL)以及用于转化子筛选鉴定的功能基因构建而成。

以酵母菌为受体细胞的表达载体都是由酵母质粒和细菌质粒重组构成的,也称为穿梭质粒(shuttle plasmid)。穿梭质粒中的细菌质粒启动子不能启动真核基因在酵母中表达,所以穿梭质粒也含有酵母启动子,如ADH(乙醇脱氢酶)、SUC(蔗糖酶)和PHOS(磷酸酯酶)启动子等。

一般而言,酵母的表达载体都是以大肠杆菌质粒为基本骨架,并具有以下构件。

1.DNA复制起始区

该区段具有复制起始功能,可以是酵母2μm质粒的复制起始区或酵母自主复制序列(autonomously replicating sequence,ARS)。2μm质粒的复制起始区与酵母ARS有一个11 bp的一致序列(AES consensus sequence,ACS):5'(A/T)TTTATPTTT(A/T)3'。在复制起始时,DNA复制起始复合物结合到该序列上。酿酒酵母基因组中的ARS能使重组质粒的转化效率大幅度提高,但提高的程度有较大差异。ARS中富含AT碱基对(70%~85%),11 bp的核心序列对于复制功能很重要,一个碱基的改变将导致复制功能丧失。核心序列的上游和下游区域对于复制也是必需的。

酵母自主复制型载体质粒的构建包括引入复制子结构、选择标记基因、多克隆位点三部分。由ARS构成的质粒称为YRp,而由2μm质粒构建的杂合质粒称为YEp。

2.选择标记

选择标记是载体转化酵母后筛选转化子时必需的构件。用于酵母转化子筛选的标记基因主要有营养缺陷互补基因和显性基因两类,前者包括营养成分合成基因,如合成氨基酸的LEU、TRP、HIS、LYS基因和合成核苷酸的URA、ADE基因等,这些基因的营养缺陷型突变株用来作为受体菌,已经在实验室研究中广泛使用。但对于工业酵母来讲,由于其多倍体的特性,不可能获得营养缺陷型,因此发展了显性选择标记系统。目前使用的显性选择标记有抗G-418的氨基糖苷磷酸转移酶基因aph、氯霉素乙酰转移酶基因cat、二氢叶酸还原酶基因dhfr、抗腐草霉素的ble基因、抗铜离子的CUP1基因、蔗糖利用的SUC2基因、抗硫酰脲除草剂的乙酰乳酸合成酶基因ILV2r以及5-烯醇丙酮酸莽草酸-3-磷酸合成酶(EPSPS)基因aroA等。显性选择标记的优点是它可以用于野生型酵母菌的转化。

3.整合介导区

整合介导区与受体菌株基因组有某种程度的同源性,介导区DNA序列能有效地介导载体与宿主染色体发生同源重组,使载体整合到宿主染色体上。根据整合介导区的设定可以控制载体整合到宿主染色体上的位置和拷贝数。

4.有丝分裂及端粒稳定区

YRp和YEp两种质粒在转化酿酒酵母后可以达到每细胞200个拷贝的水平,但稳定性较差,经过几代后质粒会丢失。YRp和YEp两种质粒的不稳定性主要是由在母细胞和子代细胞中不均匀分配引起的。为了提高质粒的稳定性,将着丝粒区域的DNA片段(CEN)插入ARS型质粒中,能明显改善质粒拷贝在母细胞和子细胞中的均匀分配,同时提高质粒在宿主细胞中的稳定性。酵母表达载体类似于微型染色体,其在宿主细胞分裂时的均匀分配是决定转化子稳定性的重要因素之一。有丝分裂稳定区可以使酵母表达载体在子代细胞中均等分配,一般是由酵母染色体的着丝粒(centromere)片段组成。此外,来自酵母2μm质粒的STB(stability)片段也有助于游离载体的有丝分裂稳定性。

酵母的CEN含有一个110~120 bp的保守区域,由CDE Ⅰ、CDE Ⅱ和CDEⅢ组成。将CEN DNA片段与含ARS的质粒重组,可构成YCp杂合质粒。其稳定性高,但拷贝数只有1~5个。YCp与YRp和YEp一样,可以高频转化酵母菌,也可在大肠杆菌和酵母菌中有效穿梭转化并维持。

为了维持线状DNA载体的稳定性,防止染色体末端粘连以及复制引起的末端缺失,在酵母染色体型载体的两端引入TEL序列,可以增强其稳定性。酿酒酵母的TEL DNA含有一个恒定的Y'区(6.7 kb)和一个X区(0.3~4.0 kb)。Y'区两侧含有几百个C1~3A重复序列,其下游是ARS。将酵母的TEL、CEN、ARS等DNA元件构建成人工染色体,可以克隆大片段外源DNA,装载量可达800 kb。如pYAC2含有2个反向的TEL DNA和SUP4、TRP1、URA3等酵母选择基因以及大肠杆菌的复制子和选择基因Ampr

5.表达盒

表达盒(expression cassette)一般由启动子、分泌信号序列和终止子等组成。酵母启动子长1~2 kb,其上游含有上游激活序列(upstream activating sequence,UAS)、上游阻遏序列(upstream repression sequence,URS)和组成型启动子序列等,其下游存在转录起始位点及TATA序列。转录因子可以结合到TATA序列形成转录起始复合物,并决定基因的基础表达水平。而一些调控蛋白则通过与上游的UAS、URS等结合,与转录起始复合物相互作用,以激活、阻遏等方式影响基因的转录效率。分泌信号序列是用于蛋白分泌表达时载体中需要的一段序列,它编码前体蛋白N端的17~30个氨基酸,可引导分泌蛋白从细胞内转移到细胞外。常见的分泌信号序列有a因子前导肽序列、蔗糖酶和酸性磷酸酯酶的信号肽序列。其中α因子前导肽序列最有效,在酵母菌中应用最广。终止子是决定mRNA 3'端稳定性的重要元件,是前体mRNA加工与多聚腺苷酸化紧密偶联所必需的。位于基因3'端的酵母终止子长度一般不超过500 bp。