7.2.3 芽孢杆菌表达系统

7.2.3 芽孢杆菌表达系统

芽孢杆菌是一类被广泛应用的重要工业微生物,其遗传学和生理学已得到深入研究,人们对其遗传背景和生理特性的了解仅次于大肠杆菌。芽孢杆菌作为典型的革兰氏阳性菌,具备了大肠杆菌等一些其他菌株所没有的优良特性。在实际应用中,芽孢杆菌可以作为不同来源的外源基因的表达宿主。

1.芽孢杆菌表达系统的优点和缺点

芽孢杆菌表达系统的优点:①呈非致病性,除个别菌种(炭疽芽孢杆菌和蜡样芽孢杆菌)外对人畜无害;②转化外源DNA的感受态系统也同样适用于转化重组DNA;③质粒和噬菌体都可以作为克隆的载体;④细胞壁的组成简单,只含有肽聚糖和磷壁质,因此在分泌的蛋白质产品中不会混杂内毒素(热源性脂多糖),而这是大肠杆菌无法比拟的;⑤能够大量分泌某些胞外蛋白,蛋白质跨越细胞膜后,被加工和直接释放到培养基中而不发生聚集,回收和纯化蛋白质较为简单;⑥具备良好的发酵基础和生产技术,在相对简单的培养基中能生长到很高的密度;⑦没有明显的密码子偏好性,同时表达产物也不容易形成包含体。在E.coli表达系统中,若重组表达的外源蛋白中含有大量连续的稀有密码子,则常常造成表达量低,或者翻译提前终止,而目的蛋白质产物形成包含体会导致蛋白质丧失活性。

芽孢杆菌表达系统的缺点:①能够产生大量的胞外蛋白酶,往往造成表达产物的大量降解;②能自发形成感受态的菌株极少,感受态持续时间短暂,分子克隆效率低;③存在限制和修饰系统,重组质粒不稳定。

2.芽孢杆菌表达系统的重要调控元件

1)σ因子

原核生物基因的转录主要由RNA聚合酶完成。RNA聚合酶全酶由σ因子和核心酶(α2ββ')5个亚基组成。σ因子的主要功能是帮助核心酶识别特定的启动子而结合到转录的起始部位。转录开始后,σ因子就不起作用了。目前,在枯草芽孢杆菌中发现了10多个σ因子,如σA(σ43、σ55)(营养生长),σB(σ37)、σD(σ28)、σE、σF、σG、σH(σ29)(平台期)、σK(生孢特异性)、gp28和gp33~34等,而大肠杆菌只有两种σ因子(σ70和σ32)。这种多σ因子现象与营养体的繁殖和芽孢形成有关,也与重叠启动子、非重叠启动子以及转录级联有关。根据σ因子级联式交替出现,提出了σ因子级联基因调控模型。该模型认为枯草芽孢杆菌及其噬菌体在不同生长时期或不同生长环境中,所表达基因的种类和程度各不相同,而σ因子的级联交替则是实现这种专一性调控的重要分子基础之一。大多数革兰氏阴性菌的基因不能够在芽孢杆菌中直接表达,而需要更换启动子等元件。

2)启动子

枯草芽孢杆菌σA因子所识别的启动子—35区和—10区与大肠杆菌类似,保守序列分别为TTGACA和TATAAT。而带其他σ因子的RNA聚合酶识别的启动子的保守区域与σA启动子存在很大差异。如σB启动子的—35区和—10区分别为AGGATT和GGAATTGTTT,σD的分别为CTAAA和CCGATAT等。σA因子识别的启动子两区域之间的间距为17~18 bp,而其他RNA聚合酶的则不定,多为15~16 bp。一般来说,当该距离偏离17 bp时,无论大或小,启动子都会变弱。

在枯草芽孢杆菌中,许多启动子的—35区上游富含AT,该AT丰富区称为转录增强区,对基因转录非常重要;在—10区的上游含有一个重要的TGTG基序(—16),这个区域的突变会显著地减弱启动子的强度。另外,在—10区与+1区之间通常也富含AT,该特点主要是便于转录起始时促进DNA的局部解链。

迄今发现的枯草芽孢杆菌启动子主要有两种形式:一是单个的启动子,多数在快速生长期表达;另一类为复合启动子,它包括串联启动子和重叠启动子。重叠启动子有以下特征:①不同类型的两个启动子重叠;②两个启动子有不同的转录起始位点或相同的起始位点;③启动子可能受时序调节。这类启动子在枯草芽孢杆菌感知外界环境的变化、时序调节、孢子形成和萌发等诸多生命现象中发挥重要作用。

3)终止子

一旦RNA聚合酶起始了转录,就会不停地合成核酸直到遇到转录终止位点。大肠杆菌中有两类转录终止位点:ρ因子依赖型和非ρ因子依赖型。在枯草芽孢杆菌基因转录终止方面,仅有少数基因得到很好的研究。它们的终止区都富含GC的倒转重复序列,后面跟着一串A(T),即非p因子依赖型的转录终止。

4)核糖体结合位点

枯草芽孢杆菌mRNA的核糖体结合位点,也称为SD序列。其典型的SD序列为5'-GGAGG-3',与大肠杆菌的5'-AAGGA-3'有所不同。一般来说,mRNA与核糖体的结合程度越强,翻译的起始效率就越高,而这种结合程度主要取决于SD序列与16S rRNA 3'端的碱基互补性,其中以GGAG这4个碱基的序列尤为重要。对多数基因而言,上述4个碱基中任何一个换成C或T,均会导致翻译效率大幅度降低。

核糖体16S rRNA 3'端参与识别mRNA并起始翻译,而枯草芽孢杆菌的16S rRNA 3'端序列与大肠杆菌是不同的,枯草芽孢杆菌的核糖体只能识别同源的mRNA。因此,来源于大肠杆菌的基因,除极个别以外,不能直接在属于革兰氏阳性菌的芽孢杆菌中表达,而芽孢杆菌的基因可以在大肠杆菌中表达。这是因为革兰氏阳性菌的核糖体30S亚基缺少S1蛋白,这可能涉及核糖体结合位点的问题,另外革兰氏阴性菌的启动子枯草芽孢杆菌不能够识别。

SD序列与起始密码子之间的序列也影响翻译效率,通常富含AT的间隔区比富含GC的间隔区翻译效率高15~50倍。SD序列下游的碱基若为AAAA或UUUU,翻译效率最高;而CCCC或GGGG的翻译效率则分别是最高值的50%和25%。紧邻AUG的前3个碱基成分对翻译起始也有影响。对于大肠杆菌β-半乳糖的mRNA而言,在这个位置上最佳的碱基组合是UAU或CUU。如果用UUC、UCA或AGG取代,酶的表达水平只有img。SD序列与起始密码子之间的精确距离保证了mRNA在核糖体上定位后,翻译起始密码子AUG正好处于核糖体复合物结构中的P位点,这是翻译启动的前提条件。一般来说,“GGAGG”的最后一个G和起始密码子的距离为7~9个碱基。在此间隔少一个或多一个碱基,均会导致翻译起始效率不同程度地降低。起始密码子在枯草芽孢杆菌中,多数基因的起始密码子为AUG,少数为GUG或UUG,AUG仍为起始密码子的最优选择。

5)蛋白质分泌

蛋白质分泌是指某些蛋白质在细胞内合成后,可以通过特定机制输送到细胞外的过程。芽孢杆菌由于没有外膜,分泌蛋白质时只需要穿过一层细胞膜,即可直接释放到环境中。因此,芽孢杆菌是生产各种酶及外源蛋白的理想宿主。

现已在枯草芽孢杆菌中发现了至少四种蛋白质分泌途径:①普通分泌途径(general secretionpathway,Sec分泌途径)。在枯草芽孢杆菌中,大约有300种(占90%以上)的胞外蛋白是通过该途径实现分泌的,其中secA、secD、secE、secF、secY、ffh和ftsY编码蛋白参与整个分泌过程。该途径的一般特点如下:核糖体首先合成带有信号肽的分泌蛋白前体,信号肽是区分胞内蛋白和分泌蛋白的标志。Sec途径要求分泌蛋白前体在转移之前不能折叠,通过细胞膜上由一组膜蛋白组成的极性通道将分泌蛋白前体转移到细胞膜外。通道蛋白含有负责定位和转移分泌蛋白的细胞质组分的结合位点。合成的分泌蛋白前体在转移前以肽链形式存在,通过Sec蛋白的ATP酶活性水解ATP和质子驱动力,驱动肽链穿过细胞膜。穿膜之后,信号肽酶切除信号肽,蛋白质折叠成正确的构象。最后,折叠成正确构象的蛋白质穿过细胞壁释放到培养基中。②双精氨酸分泌途径(twin-argininetranslocationpathway,Tat分泌途径)。Tat途径因分泌蛋白的信号肽中含有两个相邻的精氨酸残基而得名,其突出特点是可分泌在胞内已折叠形成正确构象的蛋白质。Tat途径与Sec途径有两点明显不同:一是Tat途径识别的信号肽含有R-R-X-#-#(#是疏水残基)结构;二是Tat途径可以转运紧密折叠的蛋白质甚至是多亚基酶复合物。因而Tat途径的功能是转运那些折叠迅速或紧密的蛋白质,这些蛋白质无法通过Sec途径分泌。已知枯草芽孢杆菌中通过Tat途径分泌的蛋白质只有磷酸二酯酶(PhoD),迄今为止的研究认为只有极少数的蛋白质经Tat分泌,因此该途径可以称为“特殊目的”途径。③ATP结合盒转运子途径(ATP-bindingcassettetransporter,ABC转运子途径)。该途径主要用于细菌素等分子的输出。④假菌丝蛋白输出途径(Pseudophilin pathway,Com途径)。该途径与枯草芽孢杆菌细胞感受态形成有关。

蛋白质分泌系统识别分泌蛋白的信号主要是位于蛋白质N端的信号肽。信号肽一般由三部分构成:N端由1~5个带正电荷的氨基酸组成;中间部分为7~15个疏水性氨基酸构成的核心区;C端由3~7个能被信号肽酶识别并切割的亲水性氨基酸组成。枯草芽孢杆菌的信号肽同样具有这一共性。根据枯草芽孢杆菌蛋白质分泌机制的不同,可将其信号肽分为四种类型:①sec型信号肽,参与Sec途径;②类prepilin信号肽,参与Com途径;③bacteriocin和pheromone信号肽,参与ABC转运子途径;④双精氨酸信号肽,参与Tat途径。通过计算机分析,枯草芽孢杆菌有将近300个N端具有信号肽用来跨膜的蛋白质。不过用来表达和分泌克隆基因的信号肽主要来自蛋白酶、淀粉酶和细胞壁表层蛋白等。

利用芽孢杆菌表达系统合成分泌蛋白,有时产量较低,这可能是由于分泌途径中的一个或几个瓶颈环节以及胞外蛋白酶的作用降低了培养液中目的蛋白质的产量,因此深入研究蛋白质的分泌机制是提高芽孢杆菌外源表达的关键。

利用枯草芽孢杆菌进行外源基因的分泌表达时,通常采用的策略是推测目的蛋白质可能具有的分泌途径,再将该途径可识别的信号肽融合到目的蛋白质的N端以便尝试其分泌表达水平。外源蛋白的来源菌种与枯草芽孢杆菌在进化关系上可能具有很大差别,蛋白质本身与分泌途径的相容性和相容度均为未知,因此这种策略带有较大程度的盲目性。众多研究报道表明,同一种蛋白质在不同信号肽的作用下分泌效率相差甚远,有的甚至不能分泌。因此,针对不同的蛋白质应该选择合适的信号肽来实现有效的分泌表达。目前许多实验室也在自主开发野生的芽孢杆菌表达系统,主要因其高效分泌表达的能力;另外,对于菌剂产品来讲,将外源基因在芽孢杆菌中表达,可以大大延长产品的货架期。

3.芽孢杆菌常用的宿主和载体

1)宿主

芽孢杆菌为革兰氏阳性菌,细胞壁不含内毒素,能分泌大量蛋白质到胞外,为一些重要工业酶制剂的生产菌种。对芽孢杆菌表达系统的研究首先是从枯草芽孢杆菌的研究开始,作为革兰氏阳性菌的典型代表,对于其生理、生化、遗传及分子生物学的研究已有较长的历史。近年来,随着分子生物学和基因工程的发展,枯草芽孢杆菌作为基因工程表达系统发展迅速,并展现出良好的应用前景。随着时间的推移,将会有更多种被发展成为基因工程表达系统。

(1)枯草芽孢杆菌宿主菌株:将携有外源基因的重组载体导入宿主中是基因工程表达系统的必要条件之一。早期研究发现:枯草芽孢杆菌168菌株及其突变体能转变为感受态细胞,转化和重组外源基因,可作为理想的宿主细胞。枯草芽孢杆菌168菌株突变之后,可以形成包括各式各样的营养条件、芽孢形成和萌发、蛋白酶缺失、重组缺陷、限制/修饰系统缺陷、转座子插入等方面的突变体。这些突变表型可以作为理想的筛选标记。枯草芽孢杆菌168菌株突变株可从美国俄亥俄州立大学“芽孢杆菌遗传保存中心”(BGSC)获得。后来,从我国土壤中分离出的枯草芽孢杆菌Ki-2菌株也可以成为转化菌株。在此基础上,从Ki-2菌株获得的突变体中,Ki-2-132和Ki-2-148为高频转化菌株,并建立了宿主/载体表达系统。

(2)短短小芽孢杆菌宿主菌株:短短小芽孢杆菌(Brevibacllius bervis)也具有与枯草芽孢杆菌等同的蛋白质产物分泌能力,但它所产生的胞外蛋白酶活性水平远低于枯草芽孢杆菌,因此它是一种理想的芽孢杆菌分泌表达系统宿主。短短小芽孢杆菌47菌株和HPD31菌株在合适的培养条件下,每升培养液可累积30 g蛋白质产物。蛋白质主要在细菌稳定期中合成,胞外蛋白比胞内蛋白总量高2倍,而且在常规培养基中,短短小芽孢杆菌很少产生饱子。

短短小芽孢杆菌具有独特的细胞壁结构。其47菌株含有3层细胞壁,包括2层蛋白胞壁和1层多聚糖胞壁,前者称为外壁和中壁,分别由相对分子质量为1.03×105和1.15×105的蛋白质组成。这种细胞壁结构与形态随着细胞生长周期的转换而发生变化,在稳定前期,细胞外壁和中壁蛋白开始从细胞表面脱落,与此同时胞内的可分泌型蛋白启动表达;进入稳定期后,蛋白质层几乎全部脱落,而细胞壁蛋白的合成与分泌仍继续进行一段时间,从而导致大量的细胞壁蛋白在培养基中积累。

细胞壁蛋白组分的表达和分泌还与细胞表面的结构变化有关。当细胞壁蛋白占据细胞表面时,其基因的表达被阻遏在一个恒定的低水平上,以防止这种蛋白组分的过量合成;细菌进入稳定期后,细胞壁蛋白从细胞表面的脱落以及培养基中低浓度Mg2+的存在,会使细胞壁蛋白基因的转录去阻遏,从而保证细胞壁蛋白连续合成并分泌至培养基中。由于短短小芽孢杆菌的细胞壁蛋白合成、分泌及其有效调控,其启动子、操作子、翻译起始区以及蛋白质的信号肽编码序列非常有利于实现外源基因的高效表达与分泌。短短小芽孢杆菌47株的两个细胞壁蛋白编码基因已经被克隆鉴定,它们组成一个cwp操纵子结构,其5'端的基因表达调控区域在构建短短小芽孢杆菌的表达分泌系统中得到广泛应用。

(3)可作为宿主的其他菌种:除枯草芽孢杆菌以外,已报道用作宿主表达克隆基因的有:嗜碱芽孢杆菌(Bacillusalcalophilus);解淀粉芽孢杆菌(B.amyloliquefaciens);地衣芽孢杆菌(B.licheniformis);巨大芽孢杆菌(B.megaterium);短小芽孢杆菌(B.pumilus);球形芽孢杆菌(B.sphaericus);嗜热脂肪芽孢杆菌(B.stearothermophilus);苏云金芽孢杆菌(B.thuringiensis)以及病原菌炭疽芽孢杆菌(B.anthracis)。

2)载体

目前,芽孢杆菌中常用的载体主要有自主复制质粒、整合质粒和噬菌体三种。

(1)自主复制质粒:从芽孢杆菌中分离的自主复制质粒,除极少数以外(例如pBC16),均为无抗性标记的隐秘质粒。带有抗性标记的自主复制质粒主要来自其他革兰氏阳性菌,特别是来自金黄色葡萄球菌的质粒。可复制质粒的复制子(replicon)可分为滚环型复制子(rollingcircle replicon,RCM replicon)和θ型复制子(theta replicon)。滚环型复制子质粒较典型的有pUB110、pC194和pE194,而θ型复制子质粒较典型的有pAMβ1。除个别质粒外,滚环型复制子质粒通常不稳定,在不含抗生素抗性基因的条件下易丢失,而θ型复制子质粒则要稳定得多,是进行重组表达系统构建的良好材料。迄今,已在上述质粒的基础上构建了双标记质粒、芽孢杆菌/大肠杆菌穿梭质粒、表达质粒、整合质粒和探针质粒等。

(2)整合质粒:整合质粒是一类具有选择性标记并以限制性复制为特点的质粒,它是在对枯草芽孢杆菌分子遗传学研究的早期阶段发展出来的一种非常有用的克隆载体。绝大多数的载体在革兰氏阳性菌中的拷贝数都相对低。采用整合质粒将克隆基因整合到宿主染色体,是克服芽孢杆菌质粒不稳定性的一个有效途径。整合的目的一般通过同源重组或者转座子插入来实现。这种质粒的基本结构是在大肠杆菌质粒的基础上增加一个芽孢杆菌的抗性标记,以及待整合的目的基因。它在大肠杆菌中进行基因克隆或亚克隆操作。整合质粒导入芽孢杆菌后,由于它没有芽孢杆菌质粒的复制起点而不能自主复制,只有插入宿主体后,随着细胞复制而复制。在含有整合质粒中芽孢杆菌抗性标记的抗生素的培养基上,就可以很容易挑出这种整合体。

选择性标记一般为对某种抗生素的抗性,限制性复制通常是指这类质粒在大肠杆菌中具有自主复制的功能,而在革兰氏阳性菌(如枯草芽孢杆菌)中不能自主复制。因此在有选择性压力存在的条件下,当这种质粒被转化入枯草芽孢杆菌后,所有的转化子都将质粒整合进染色体或其他能够自主复制的DNA单元中。整合质粒一般带有和枯草芽孢杆菌染色体同源的DNA序列,并在同源位点处整合入染色体。如果整合质粒中只带有一段同源DNA序列,它将通过Campbell机制和染色体发生一个单交换而全部整合到染色体中;当它带有两段在染色体上相距比较近的同源DNA序列时,则还可以和染色体发生双交换而部分整合在染色体中。

整合质粒在枯草芽孢杆菌分子遗传学的研究中通常有以下几种用途:①基因敲除。带有目的基因部分序列的整合质粒可以通过单交换方式插入所研究的目的基因中而破坏其功能,因此可以用来构建目的基因的缺陷株,通过缺陷株的表型变化来研究目的基因的功能。②染色体步移。用合适的限制性核酸内切酶处理带有整合质粒的染色体,然后将酶切处理过的染色体片段自连,往往可以得到带有旁侧序列的“新”整合质粒。在早期的枯草芽孢杆菌遗传学研究中,这种载体在确定染色体图谱方面是非常有用的。③报告基因的融合。利用整合载体可以很方便地将报告基因整合在染色体上,从而研究目的基因在单拷贝的自然状态下的转录和表达水平。④基因的异位整合。利用双交换整合,可以方便地把不同的基因整合在染色体的同一个“中立”位点上来比较它们在“中立”位点的转录和表达水平,这可以有效地排除不同的整合位点对转录所造成的干扰。⑤染色体上DNA序列的扩增。整合质粒通过Campbell机制整合入染色体后,在所插入的质粒两侧具有同向重复序列,利用这种序列可以实现插入质粒在染色体上的串联扩增。因此,仅仅通过提高抗生素的浓度,就可以筛选到目的基因剂量增加的菌株。当细胞内的染色体进行复制时,其中一条染色体因为偶然发生分子内重组而使整合质粒从该条染色体上脱落下来,一旦脱落的质粒通过Campbell机制而整合入另一条染色体中,就导致整合质粒在该染色体上的串联扩增。随着扩增程度的增加,细胞内两条染色体之间在重复序列处的双交换重组也能导致其中一条染色体上重复序列扩增程度增加,而另一条染色体上的扩增序列则丢失。

(3)噬菌体:不少噬菌体都可用作载体,如Φ105噬菌体、SPβ噬菌体、sppl噬菌体和spplv噬菌体等。其中Φ105噬菌体应用较多,它是温和型噬菌体,基因组约为39.2 kb,从中发展了不少载体,如Φ105dcM、Φ105J27等。sppl噬菌体是毒性噬菌体,有一个非必需区,占基因组DNA序列的10%。利用带BamH Ⅰ酶切位点的接头取代该非必需区,构成spplv噬菌体载体。该载体可克隆Bam H Ⅰ、Bgl Ⅱ和Bcl Ⅰ酶切片段,DNA片段的最大尺寸可达6 kb左右。

SPβ噬菌体为原噬菌体,基因组约120 kb,枯草芽孢杆菌168菌株及其衍生株都带有此原噬菌体。枯草芽孢杆菌Ki-2-132中也发现了缺陷的原噬菌体。

目的基因一般在体外包装之后,经噬菌体介导(转导)而进入宿主菌进行重组和表达。