真核生物的基因结构与调控模式

四、真核生物的基因结构与调控模式

真核生物(eukaryote)的结构基因为断裂基因。编码序列外显子被内含子间隔开。不同的基因中,外显子的数量并非定数,因此外显子的数目也是描述基因结构的重要特征之一。

外显子、内含子连同5′UTR、3′UTR构成的结构基因转录区,在转录的同时被转录下来,转录的初产物称为前体mRNA(pre-mRNA),又称为不均一核RNA(heterogeneous nuclear RNA,hnRNA)。经过剪接加工后,内含子被切除,外显子依次连接,成为成熟mRNA,图2-5所示即为断裂基因及其转录、转录后修饰示意图。研究发现,内含子并不是一些垃圾序列,有些内含子中含有调控信息,甚至含有增强子。内含子和外显子的划分也不是绝对的,有些基因的内含子被选择性剪接后也可成为编码序列外显子。

图2-5 断裂基因及其转录、转录后修饰示意图

图2-5中,图上方为成熟mRNA与基因DNA杂交的电镜结果示意,虚线代表mRNA,实线代表DNA模板;(a)为卵清蛋白基因;(b)为转录初级产物hnRNA;(c)为hnRNA的首、尾修饰;(d)为剪接过程中套索RNA的形成;(e)为胞浆中出现的mRNA,套索已去除;A、B、C、D、E、F、G为内含子;L、1、2、3、4、5、6、7为外显子。迄今发现的人类最大的基因是抗肌萎缩蛋白基因,它全长有数百万个核苷酸对,由50多个外显子和50多个内含子间隔排列,成熟的mRNA仍有万余个核苷酸。

真核生物基因中除外显子与内含子序列以外,其他部分都具有调节基因表达的作用,包括启动子、上游启动子元件、一些能与调节蛋白结合的应答元件和增强子等,它们被统称为顺式调控元件或顺式作用元件(图2-6),即那些与结构基因表达调控相关、能够被调控蛋白特异性识别和结合的DNA序列。一些蛋白质因子可通过与顺式作用元件结合调节基因转录,这些蛋白质因子被称为反式作用因子或转录因子。

(1)启动子 真核生物的每一个结构基因上游都有启动子,各个基因的启动子序列具有较高的同源性。真核生物基因的启动子自身并不足以被RNA聚合酶识别与结合,启动子必须与转录因子结合后,才能被RNA聚合酶识别与结合,这一点与原核基因启动子不同。

图2-6 真核生物基因5′端启动子的顺式调控元件示意图转录方向以箭头表示,+1表示转录起始点

TATA盒是启动子中的主要元件,它位于转录起始点上游约-30 bp处,几乎所有已发现的真核生物基因的启动子都有此序列。TATA盒的核心序列是TATA(A/T)A(A/T)。TATA盒与一种称为TATA因子的转录因子结合后即成为完整的启动子,精确地决定RNA合成的起始位点,其序列的完整与准确对其功能十分重要,如某些碱基发生突变,甚至A和T的颠换突变都能导致启动子失活或转录效率降低。

(2)上游启动子元件 上游启动子元件是TATA盒上游的一些特定DNA序列,反式作用因子可与这些元件结合,通过调节TATA因子与TATA盒的结合、RNA聚合酶与启动子的结合及转录起始复合物的形成(转录起始因子与RNA聚合酶结合)来调控基因的转录效率。

上游启动子元件包括CAAT盒、CACA盒及GC盒等。CAAT盒含有5′GGNCAATCT3′核心序列,GC盒含有5′GGGCGG 3′核心序列,二者位于-70 bp和-120 bp之间,CACA盒位于上游-80 bp和-90 bp处,其核心序列为GCCACACCC。大多数真核生物基因具有CAAT盒;一些组成型基因,即不受生物体发育调节而持续表达的基因具有GC盒。CAAT盒与GC盒的作用类似于原核基因-35区的作用,是反式作用因子识别与结合的位点。不过,原核生物启动子中的-35序列位置恒定,而CAAT盒与GC盒在不同基因中所处的位置不同。

(3)应答元件 它是一类能介导基因对细胞外的某种信号产生反应的DNA序列,被称为反应元件。反应元件都具有较短的保守序列,通常位于启动子附近和增强子内,如热休克反应元件(heat shock response element,HSE)一般在启动子内,糖皮质激素反应元件(glucocorticoid response element,GRE)在增强子内。与反应元件结合的信息分子受体便是一些反式作用因子,如糖皮质激素可进入细胞,与糖皮质激素受体结合并使之活化,活化的糖皮质激素受体则与GRE结合,促进特定的基因表达。

(4)增强子 增强子是一段DNA序列,其中含有多个能被反式作用因子识别与结合的顺式作用元件。反式作用因子与这些元件结合后能够调控(通常为增强)邻近基因的转录。增强子一般位于转录起始点上游-100 bp至-300 bp处,但在基因序列之外或内含子中也有增强子序列。

增强子主要通过改变DNA模板的螺旋结构,为DNA模板提供特定的局部微环境或为RNA聚合酶和反式作用因子提供一个与某些顺式元件联系的结构等方式发挥作用。其作用无方向性,无基因特异性,也不受与基因之间距离远近的影响。

1986年,Maniatis等研究干扰素-β(IFN-β)基因转录时发现其增强子内具有负调控序列,即负增强子,又称沉默子。由于负调控序列的发现,有人建议用调变子(modulator)代替增强子的概念。