第十五章 基因表达的调控
每种生物在生长发育和分化的过程中,以及在对外环境的反应中各种相关基因有条不紊的表达起着至关重要的作用。在原核生物中,一些与代谢有关的酶基因表达的调控主要表现为对生长环境变化的反应和适应。与原核生物相比,真核生物基因表达的调控更为复杂,真核生物基因表达的调控主要是指编码蛋白质的mRNA的形成与使用的调节与控制。基因表达的过程,以真核生物为例,包括以下几个环节:基因的活化——>转录——>转录后的加工——>mRNA转运至细胞质——>翻译——>翻译后加工,上述各个环节都可以是受调控的点,本章所介绍的主要是转录水平的调控。
第一节 原核生物基因表达的调控
原核生物在对外环境突然变化的反应中,是通过诱导或阻遏合成一些相应的蛋白质来调整与外环境之间的关系。由于原核生物的转录与翻译的过程是偶联的(图15—1),而且这种过程所经历的时间很短,只需数分钟,同时由于大多数原核生物的mRNA在几分钟内就受到酶的影响而降解,因此就消除了外环境突然变化后所造成的不必要的蛋白质的合成。与真核生物相比,原核生物基因表达的一个特点是快速。
下面分别以大肠埃希菌(E.coli)的乳糖操纵子(1actose operon,属可诱导操纵子)和色氨酸操纵子(triptophan operon,属可阻遏操纵子)为例介绍原核生物转录起始和转录终止的调控。
一、乳糖操纵子
(一)乳糖操纵子的结构和诱导剂
所谓操纵子是指一些成簇排列、相互协同的基因所组成的单位,也称基因表达的协同单位(a coordinated unit of gene expression)。在乳糖操纵子中有Z基因(编码β-半乳糖苷酶,β-galactosidase),Y基因(编码通透酶,permease),a基因(编码转乙酰基酶,transacetylase),上述Z、Y、a是结构基因;P(启动子,promoter),O(操纵基因,operator)是调控基因;I(编码Lac阻遏物,Lac repressor)不属于乳糖操纵子。(图15—2)。大肠埃希菌能利用乳糖作为碳源,但要将乳糖水解为半乳糖和葡萄糖,催化此水解反应的是β-半乳糖苷酶。由于Z、Y、a以多顺反子(polycistron)形式存在,即三种基因被转录到同一条mRNA上,因此乳糖能同时等量地诱导三种酶的合成。通透酶的作用是使乳糖能透过细菌壁,转乙酰基酶的作用还不清楚。在大肠埃希菌内,真正生理性的诱导剂并非乳糖,而是别位乳糖(allo-lactose),也是由乳糖经β-半乳糖苷酶(未经诱导少量存在于细菌内)催化形成,并再经β-半乳糖苷酶水解为半乳糖和葡萄糖(图15-3)。
(二)Lac阻遏物的作用
Lac阻遏物是一种具有四级结构的蛋白质,4个亚基相同(分子质量 37000),都有一个与诱导剂(生理性诱导剂为别位乳糖,实验常用的诱导剂是异丙基硫代半乳糖一IPTG)的结合位点。在没有诱导剂的情况下,Lac阻遏物能快速与操纵基因O结合,从而阻碍结构基因的转录。当有诱导剂与Lac阻遏物结合后,阻遏物的构象就发生变化,导致阻遏物从操纵基因O上解离下来,RNA聚合酶不再受阻碍,能转录结构基因Z、Y、a(图15-4)。Lac阻遏物与操纵基因O结合时所覆盖的区域为28 bp。
(三)CAP与cAMP复合物在乳糖操纵子表达中的作用
大肠埃希菌具有优先利用葡萄糖作为能源的特点。当大肠埃希菌在含有葡萄糖的培养剂中生长时,一些分解代谢酶,如β-半乳糖苷酶、半乳糖激酶、阿拉伯糖异构酶、色氨酸酶等的水平都很低,这种葡萄糖对其他酶的抑制效应称为分解物阻遏作用(catabolite repression),这种现象与cAMP有关。葡萄糖能降低大肠埃希菌中cAMP的浓度,而加入外源性cAMP能逆转葡萄糖的这种抑制作用。cAMP能刺激多种可诱导的操纵子(inducible operon),包括乳糖操纵子转录的启动。从这点上来说,cAMP在细菌和哺乳动物中的作用是相同的,都是作为饥饿信号(hunger signal),但作用机制全然不同,在哺乳动物细胞,cAMP的作用是激活蛋白激酶,再由蛋白激酶磷酸化其他靶蛋白质分子,例如,调控糖原合成和分解的机制;而细菌中cAMP的作用是通过和一种称为分解物基因激活物蛋白(catabolite gene activator protein,CAP)结合后发挥作用。CAP是一种具有两个相同亚基的蛋白质,每个亚基都具有与DNA结合的结构域和与cAMP结合的结构域。CAP与cAMP结合的复合物才能刺激操纵子结构基因的转录。在乳糖操纵子上CAP与DNA结合的区域正好在启动子P的上游。当没有葡萄糖存在(或低浓度葡萄糖)时,cAMP-CAP复合物结合到相应的DNA序列,并刺激RNA聚合酶的转录作用(能使转录效率提高50倍),这种作用当然是在没有Lac阻遏物与操纵基因O结合的情况下才能发生(图15-5)。在没有CAP-cAMP的情况下,RNA聚合酶与启动子并不形成具有高效转录活性的开放复合体,因此乳糖操纵子结构基因的高表达既需要有诱导剂乳糖的存在(使Lac阻遏物失活),又要求无葡萄糖或低浓度葡萄糖的条件(增高cAMP浓度,并形成CAP-cAMP复合物促进转录)。
乳糖操纵子调控模式在一定程度上也反映了原核生物基因表达调控的一般情况:第一,环境条件的变化是相关基因表达的外界信号,如葡萄糖,乳糖浓度的变化是乳糖操纵子结构基因是否转录的外界条件和信号;第二,基因表达的负调控(negative regulation),即调控蛋白质与相应的DNA序列结合后,能阻遏基因的表达,如Lac阻遏物与操纵基因O结合后就抑制了结构基因的表达,在乳糖操纵子这种阻遏作用能被诱导剂解除;第三。基因表达的正调控(positive regulation),即调控蛋白与相应的DNA序列结合后,能促进基因的表达。如CAP-cAMP就是一种在多种原核生物操纵子中发挥正调控作用的复合物。
二、色氨酸操纵子
原核生物的转录终止阶段,也可以是基因表达调控的环节,色氨酸操纵子的调控模式就是一个典型的例子。色氨酸操纵子的结构基因包括编码5种酶的基因E、D、C、B、A,5种酶在催化分支酸(chorismate)转变为色氨酸的过程中发挥作用,结构基因中还包括L基因,其转录产物是前导mRNA,调控元件有启动子P和操纵基因O(图15-6)。色氨酸操纵子表达的调控有两种机制,一种是通过阻遏物的负调控,另一种是通过衰减作用(attenuation)。
(一)阻遏物对色氨酸操纵子的调控
色氨酸阻遏物是一种同二聚体蛋白质(由两个相同的亚基组成),每个亚基有107个氨基酸残基。色氨酸阻遏物本身不能和操纵基因O结合,必须和色氨酸结合后才能与操纵基因O结合,从而阻遏结构基因表达,因此色氨酸是一种共阻遏物(corepressor)。
(二)衰减作用对色氨酸操纵子的调控
色氨酸操纵子转录的衰减作用是通过衰减子(attenuator)调控元件使转录终止。色氨酸操纵子的衰减子位于L基因中,离E基因5’端约30—60 bp。大肠埃希菌在无或低色氨酸环境中培养时,能转录产生具有6720个核苷酸的全长多顺反子mRNA,包括L基因和结构基因。培养剂中色氨酸浓度增加时,上述全长多顺反子mRNA合成减少,但L基因5’端部分的140个核苷酸的转录产物并没有减少(图15-6)。这种现象是由衰减子造成的,而不是由于阻遏物-共阻遏物的作用所致。这段140个核苷酸序列就是衰减子序列。衰减子转录物具有4段能相互之间配对形成二级结构的片段,如图15-7所示,片段1-和2配对形成发夹结构时,片段3和4同时能配对形成发夹结构;而片段2和3形成发夹结构时,其他片段配对二级结构就不能形成。片段3+和4及其下游的序列与ρ因子不依赖转录终止有关序列相似(见第十三章)。
L基因的部分转录产物(含片段1)能被翻译产生具有14个氨基酸残基的肽链(前导肽),其中含有两个相邻的色氨酸残基(图15-7)。编码此相邻的两个色氨酸密码,以及原核生物中转录与翻译过程的偶联是产生衰减作用的基础。如图15-8所示,当L基因转录后核糖体就与mRNA结合,并翻译L序列。在高浓度色氨酸环境中,能形成色氨酰-tRNA,核糖体在翻译过程中能通过片段1,同时影响片段2和3之间的发夹结构形成,但片段3和4之间能形成发夹结构,这个结构就是P因子不依赖的转录终止结构,因此RNA聚合酶的作用停止。当色氨酸缺乏时,色氨酰-tRNA也相应缺乏,此时核糖体就停留在两个相邻的色氨酸密码的位置上,片段1和2之间不能形成发夹结构,而片段2和3之间可形成发夹结构,结果使色氨酸操纵子得以转录。
在转录水平,真核生物和原核生物的调控机制基本相似,但至少在三方面真核生物基因表达的调控有其自身的特征:第一,转录的激活与被转录区域的染色质结构变化有关;第二,原核生物基因表达有负调控和正调控,而真核生物基因表达以正调控为主;第三,真核生物的转录和翻译两个过程在细胞内区域化上是分开的,转录在细胞核内进行,翻译在细胞质进行。
一、具有转录活性的染色质结构的变化
真核生物基因组中仅有很小部分的序列是编码蛋白质的。在哺乳动物,只有2%的DNA序列编码蛋白质,这部分序列的DNA信息通过转录和翻译成为具有各种功能的蛋白质。其中,有些基因的表达是比较恒定的,其转录产物在所有的组织细胞中都存在,这类基因称为管家基因(housekeeping genes),这类基因的表达称为组成性表达(constitutive gene expression)。有些基因的表达会因为细胞对信号分子的反应而发生变化,称为可调控的基因表达(regulated gene expression)。
在具有转录活性的染色质区域,可以观察到一些变化,最明显的是该区域对核酸酶介导的DNA降解的敏感性增强。在具有转录活性区域的一些DNA序列对DNA酶I的敏感性特别高,因此称为DNA酶I的高敏感区(hypersensitive sites),这部分DNA序列一般在100至200 bp,常位于被转录基因5’端1000 bp范围之内。许多高敏感区和一些与基因表达有关的调控蛋白与DNA结合的区域是一致的,这些区域一般不存在核小体结构。
具有转录活性的染色质区域缺乏组蛋白H1,其他组蛋白成分常发生乙酰化(acetylation),或有一种叫泛素(ubiquitin)的蛋白质附着。
具有转录活性的染色质区域的DNA通常是去甲基化的。启动子附近DNA序列的甲基化可以抑制转录起始,与基因静止相关。甲基化一般发生在具有CpG序列的胞嘧啶第5位碳原子上。DNA甲基化的异常与肿瘤发生密切相关。
上述这些具有转录活性的染色质结构的改变,都是为转录的启动作准备,使RNA聚合酶和一些转录因子得以接近被转录基因的调控序列。基因活化的过程是染色质与转录相关的结构改变的过程,此过程称为染色质重建(chromatin remodeling)。
二、参与基因调控的顺式作用元件和反式作用因子
(一)顺式作用元件
这类调控元件是指那些和被转录的结构基因在距离上比较接近的DNA序列,包括启动子(及启动子上游近侧序列)及增强子等。
1.启动子和启动子上游近侧序列 编码蛋白质基因的启动子和启动子上游近侧序列中有3种短序列的突变能导致启动子功能的丧失,这3种短序列分别是TATA盒、CAAT盒、GC盒(已在第十三章作初步介绍)。启动子及启动子近侧的保守序列元件按它们对RNA聚合酶的影响,可分为两类,一类是位于较上游的元件,能较强地影响转录起始的效率,CAAT盒和GC盒即属于这类顺式元件;另一类是位于距转录起始点较近的TATA盒,在选择转录起始点的过程中起调控作用。
2.增强子 增强子是一类能增强真核细胞某些启动子功能的顺式作用元件。增强子作用不受序列方向的制约,即顺的和反的序列都有作用,而且在离启动子相对较远的上游或下游都能发挥作用,有的增强子位于基因中间(通常位于内含子中)。有的增强子只能在特异的组织中作用,例如免疫球蛋白基因的增强子(Oct-2)只能在表达该基因的B淋巴细胞中发挥作用,这种具有组织特异性的增强子可能是作为某些特异基因表达调控网络的组成部分而发挥作用。
3.反应元件(response elements) 当真核细胞处于某一特定环境时,有反应的基因具有相同的顺式作用元件,这类顺式元件称为反应元件。例如热激反应元件(HSE)、激素反应元件(HRE,在第十六章将作较深入介绍),金属反应元件(MRE)等。这些反应元件一般具有较短的保守序列,与转录起始点的距离不固定,一般在200 bp之内。有些反应元件在启动子或增强子内,如HSE在启动子内,糖皮质激素反应元件(GRE)在增强子内。
(二)反式作用因子
反式作用因子(简称反式因子),也称转录因子(transcription factors),是一类在细胞核内发挥作用的蛋白质因子。反式因子的作用特点是:①能识别启动子、启动子近侧元件和增强子等顺式元件中的特异靶序列,如转录因子TFⅡD能识别和结合TATA盒,转录因子Spl能识别和结合GC盒,CTFl能识别和结合CAAT盒(图15-9)。RNA聚合酶本身不能有效地启动或不能启动转录,只有当反式因子与相应的顺式元件结合后才能启动或有效启动转录。这种对基因转录启动的调控是通过结合在不同顺式元件上的反式因子之间或反式因子与RNA聚合酶之间的相互作用而实现的。
反式因子具有两个必需的结构域,一个是能与顺式元件结合的结构域,能识别特异的DNA序列;另一个是激活结构域,其功能是与其他反式因子或RNA聚合酶结合,正是由于反式因子激活结构域的这种功能,才能使一些离TATA盒较远(几个kb)的顺式元件所结合的反式因子能参与转录起始的调控。由于DNA分子是柔性的,能成环状,这是结合在相距较远的顺式元件上的反式因子之间相互作用的基础。真核生物基因转录的启动由多个转录因子参与,而不同转录因子组合的相互作用能启动不同基因的转录。
(三)反式作用因子结构的模式
反式因子与相应顺式元件结合的结构域,可归纳为如下几种模式:
1.螺旋一转角一螺旋(helix-turn-helix) 具有这种结构模式的转录调控蛋白最初在原核生物中发现,如本章提到的CAP。
2.锌指(zinc fingers) 锌指结构含有约30个氨基酸残基,其中4个氨基酸残基(两个是半胱氨酸,两个是组氨酸,或4个都是半胱氨酸)以配位键与Zn2+相互作用(图15—10)。这种结构模式在多种真核转录因子的DNA结合结构域中存在,而且都具有多个相同的锌指,转录因子TFⅢA(与转录5S RNA基因有关)具有9个锌指,每个锌指都能与DNA双螺旋大沟结合(图15-11)
3.亮氨酸拉链(1eucine zippers) 这种结构是指在反式因子的一段肽链中每隔7个氨基酸残基就有一个亮氨酸残基出现,这段肽链所形成的(—螺旋就会出现一个由亮氨酸残基构成的疏水面,而另一面则是由亲水性氨基酸残基所构成的亲水面(图15-12)。由亮氨酸残基组成的疏水面即为亮氨酸拉链条,两个具有亮氨酸拉链条的反式因子,就能借疏水作用形成二聚体(图15-13),有些反式因子要形成二聚体后才能发挥作用,二聚体可以是同二聚体(homodimer,即由两个相同的反式因子组成),也可以是异二聚体(heterodimer,即由两个不同的反式因子组成)。亮氨酸拉链对二聚体的形成是必需的,但不直接参与和DNA的相互作用,参与和DNA结合的是“拉链”区以外的结构。
4.螺旋-环-螺旋(helix-loop-helix) 这种结构也和亮氨酸拉链一样与形成反式因子二聚体有关。控制多细胞生物体有关基因表达的反式因子往往具有这种结构。这种结构具有比较保守的含有50个氨基酸残基的肽段,既含有与DNA结合的结构,又含有形成二聚体的结构,这部分肽段能形成两个较短的(-螺旋,两个(-螺旋之间有一段能形成环状的肽链,(-螺旋是兼性,即具有疏水面和亲水面(上述亮氨酸拉链也是兼性(-螺旋)。两个具有螺旋-环-螺旋的反式因子能形成二聚体,二聚体的形成有利于反式因子的DNA结合结构域与DNA结合(图15—14)。
(四)反式作用因子的作用特点和规律
1.一种反式因子能与一种以上的顺式元件结合 真核生物的转录因子不像原核生物的调控蛋白与顺式调控元件的结合有高度的专一性,有些反式因子可以和同源性很小的顺式元件结合。
2.一种顺式元件能和一种以上的反式因子结合 与CAAT盒结合的反式因子有好几类,如CTF类反式因子,CP类反式因子等。多种反式因子识别同一顺式元件,能加强这些反式因子单独或协同调节基因表达的精确性和灵活性。
3.有些反式因子以二聚体或多聚体与顺式元件作用 反式因子二聚体形成的机制已在前文提及,二聚体以不同因子形成的异二聚体为主。
4。有些反式因子的活性通过化学修饰受到调节 有些反式因子激活基因转录的活性,是在磷酸化后才具有的。
5.有些反式因子之间的相互作用对它们发挥功能是必需的 在RNA聚合酶Ⅱ发挥转录作用时,几种转录因子如TFⅡA、TFⅡB、TFⅡD、TFⅡE的相互作用是必需的,几种反式因子和RNA聚合酶Ⅱ按一定的时间和空间顺序,形成具有活性的转录起始复合物。
每种生物在生长发育和分化的过程中,以及在对外环境的反应中各种相关基因有条不紊的表达起着至关重要的作用。在原核生物中,一些与代谢有关的酶基因表达的调控主要表现为对生长环境变化的反应和适应。与原核生物相比,真核生物基因表达的调控更为复杂,真核生物基因表达的调控主要是指编码蛋白质的mRNA的形成与使用的调节与控制。基因表达的过程,以真核生物为例,包括以下几个环节:基因的活化——>转录——>转录后的加工——>mRNA转运至细胞质——>翻译——>翻译后加工,上述各个环节都可以是受调控的点,本章所介绍的主要是转录水平的调控。
第一节 原核生物基因表达的调控
原核生物在对外环境突然变化的反应中,是通过诱导或阻遏合成一些相应的蛋白质来调整与外环境之间的关系。由于原核生物的转录与翻译的过程是偶联的(图15—1),而且这种过程所经历的时间很短,只需数分钟,同时由于大多数原核生物的mRNA在几分钟内就受到酶的影响而降解,因此就消除了外环境突然变化后所造成的不必要的蛋白质的合成。与真核生物相比,原核生物基因表达的一个特点是快速。
下面分别以大肠埃希菌(E.coli)的乳糖操纵子(1actose operon,属可诱导操纵子)和色氨酸操纵子(triptophan operon,属可阻遏操纵子)为例介绍原核生物转录起始和转录终止的调控。
一、乳糖操纵子
(一)乳糖操纵子的结构和诱导剂
所谓操纵子是指一些成簇排列、相互协同的基因所组成的单位,也称基因表达的协同单位(a coordinated unit of gene expression)。在乳糖操纵子中有Z基因(编码β-半乳糖苷酶,β-galactosidase),Y基因(编码通透酶,permease),a基因(编码转乙酰基酶,transacetylase),上述Z、Y、a是结构基因;P(启动子,promoter),O(操纵基因,operator)是调控基因;I(编码Lac阻遏物,Lac repressor)不属于乳糖操纵子。(图15—2)。大肠埃希菌能利用乳糖作为碳源,但要将乳糖水解为半乳糖和葡萄糖,催化此水解反应的是β-半乳糖苷酶。由于Z、Y、a以多顺反子(polycistron)形式存在,即三种基因被转录到同一条mRNA上,因此乳糖能同时等量地诱导三种酶的合成。通透酶的作用是使乳糖能透过细菌壁,转乙酰基酶的作用还不清楚。在大肠埃希菌内,真正生理性的诱导剂并非乳糖,而是别位乳糖(allo-lactose),也是由乳糖经β-半乳糖苷酶(未经诱导少量存在于细菌内)催化形成,并再经β-半乳糖苷酶水解为半乳糖和葡萄糖(图15-3)。
(二)Lac阻遏物的作用
Lac阻遏物是一种具有四级结构的蛋白质,4个亚基相同(分子质量 37000),都有一个与诱导剂(生理性诱导剂为别位乳糖,实验常用的诱导剂是异丙基硫代半乳糖一IPTG)的结合位点。在没有诱导剂的情况下,Lac阻遏物能快速与操纵基因O结合,从而阻碍结构基因的转录。当有诱导剂与Lac阻遏物结合后,阻遏物的构象就发生变化,导致阻遏物从操纵基因O上解离下来,RNA聚合酶不再受阻碍,能转录结构基因Z、Y、a(图15-4)。Lac阻遏物与操纵基因O结合时所覆盖的区域为28 bp。
(三)CAP与cAMP复合物在乳糖操纵子表达中的作用
大肠埃希菌具有优先利用葡萄糖作为能源的特点。当大肠埃希菌在含有葡萄糖的培养剂中生长时,一些分解代谢酶,如β-半乳糖苷酶、半乳糖激酶、阿拉伯糖异构酶、色氨酸酶等的水平都很低,这种葡萄糖对其他酶的抑制效应称为分解物阻遏作用(catabolite repression),这种现象与cAMP有关。葡萄糖能降低大肠埃希菌中cAMP的浓度,而加入外源性cAMP能逆转葡萄糖的这种抑制作用。cAMP能刺激多种可诱导的操纵子(inducible operon),包括乳糖操纵子转录的启动。从这点上来说,cAMP在细菌和哺乳动物中的作用是相同的,都是作为饥饿信号(hunger signal),但作用机制全然不同,在哺乳动物细胞,cAMP的作用是激活蛋白激酶,再由蛋白激酶磷酸化其他靶蛋白质分子,例如,调控糖原合成和分解的机制;而细菌中cAMP的作用是通过和一种称为分解物基因激活物蛋白(catabolite gene activator protein,CAP)结合后发挥作用。CAP是一种具有两个相同亚基的蛋白质,每个亚基都具有与DNA结合的结构域和与cAMP结合的结构域。CAP与cAMP结合的复合物才能刺激操纵子结构基因的转录。在乳糖操纵子上CAP与DNA结合的区域正好在启动子P的上游。当没有葡萄糖存在(或低浓度葡萄糖)时,cAMP-CAP复合物结合到相应的DNA序列,并刺激RNA聚合酶的转录作用(能使转录效率提高50倍),这种作用当然是在没有Lac阻遏物与操纵基因O结合的情况下才能发生(图15-5)。在没有CAP-cAMP的情况下,RNA聚合酶与启动子并不形成具有高效转录活性的开放复合体,因此乳糖操纵子结构基因的高表达既需要有诱导剂乳糖的存在(使Lac阻遏物失活),又要求无葡萄糖或低浓度葡萄糖的条件(增高cAMP浓度,并形成CAP-cAMP复合物促进转录)。
乳糖操纵子调控模式在一定程度上也反映了原核生物基因表达调控的一般情况:第一,环境条件的变化是相关基因表达的外界信号,如葡萄糖,乳糖浓度的变化是乳糖操纵子结构基因是否转录的外界条件和信号;第二,基因表达的负调控(negative regulation),即调控蛋白质与相应的DNA序列结合后,能阻遏基因的表达,如Lac阻遏物与操纵基因O结合后就抑制了结构基因的表达,在乳糖操纵子这种阻遏作用能被诱导剂解除;第三。基因表达的正调控(positive regulation),即调控蛋白与相应的DNA序列结合后,能促进基因的表达。如CAP-cAMP就是一种在多种原核生物操纵子中发挥正调控作用的复合物。
二、色氨酸操纵子
原核生物的转录终止阶段,也可以是基因表达调控的环节,色氨酸操纵子的调控模式就是一个典型的例子。色氨酸操纵子的结构基因包括编码5种酶的基因E、D、C、B、A,5种酶在催化分支酸(chorismate)转变为色氨酸的过程中发挥作用,结构基因中还包括L基因,其转录产物是前导mRNA,调控元件有启动子P和操纵基因O(图15-6)。色氨酸操纵子表达的调控有两种机制,一种是通过阻遏物的负调控,另一种是通过衰减作用(attenuation)。
(一)阻遏物对色氨酸操纵子的调控
色氨酸阻遏物是一种同二聚体蛋白质(由两个相同的亚基组成),每个亚基有107个氨基酸残基。色氨酸阻遏物本身不能和操纵基因O结合,必须和色氨酸结合后才能与操纵基因O结合,从而阻遏结构基因表达,因此色氨酸是一种共阻遏物(corepressor)。
(二)衰减作用对色氨酸操纵子的调控
色氨酸操纵子转录的衰减作用是通过衰减子(attenuator)调控元件使转录终止。色氨酸操纵子的衰减子位于L基因中,离E基因5’端约30—60 bp。大肠埃希菌在无或低色氨酸环境中培养时,能转录产生具有6720个核苷酸的全长多顺反子mRNA,包括L基因和结构基因。培养剂中色氨酸浓度增加时,上述全长多顺反子mRNA合成减少,但L基因5’端部分的140个核苷酸的转录产物并没有减少(图15-6)。这种现象是由衰减子造成的,而不是由于阻遏物-共阻遏物的作用所致。这段140个核苷酸序列就是衰减子序列。衰减子转录物具有4段能相互之间配对形成二级结构的片段,如图15-7所示,片段1-和2配对形成发夹结构时,片段3和4同时能配对形成发夹结构;而片段2和3形成发夹结构时,其他片段配对二级结构就不能形成。片段3+和4及其下游的序列与ρ因子不依赖转录终止有关序列相似(见第十三章)。
L基因的部分转录产物(含片段1)能被翻译产生具有14个氨基酸残基的肽链(前导肽),其中含有两个相邻的色氨酸残基(图15-7)。编码此相邻的两个色氨酸密码,以及原核生物中转录与翻译过程的偶联是产生衰减作用的基础。如图15-8所示,当L基因转录后核糖体就与mRNA结合,并翻译L序列。在高浓度色氨酸环境中,能形成色氨酰-tRNA,核糖体在翻译过程中能通过片段1,同时影响片段2和3之间的发夹结构形成,但片段3和4之间能形成发夹结构,这个结构就是P因子不依赖的转录终止结构,因此RNA聚合酶的作用停止。当色氨酸缺乏时,色氨酰-tRNA也相应缺乏,此时核糖体就停留在两个相邻的色氨酸密码的位置上,片段1和2之间不能形成发夹结构,而片段2和3之间可形成发夹结构,结果使色氨酸操纵子得以转录。
在转录水平,真核生物和原核生物的调控机制基本相似,但至少在三方面真核生物基因表达的调控有其自身的特征:第一,转录的激活与被转录区域的染色质结构变化有关;第二,原核生物基因表达有负调控和正调控,而真核生物基因表达以正调控为主;第三,真核生物的转录和翻译两个过程在细胞内区域化上是分开的,转录在细胞核内进行,翻译在细胞质进行。
一、具有转录活性的染色质结构的变化
真核生物基因组中仅有很小部分的序列是编码蛋白质的。在哺乳动物,只有2%的DNA序列编码蛋白质,这部分序列的DNA信息通过转录和翻译成为具有各种功能的蛋白质。其中,有些基因的表达是比较恒定的,其转录产物在所有的组织细胞中都存在,这类基因称为管家基因(housekeeping genes),这类基因的表达称为组成性表达(constitutive gene expression)。有些基因的表达会因为细胞对信号分子的反应而发生变化,称为可调控的基因表达(regulated gene expression)。
在具有转录活性的染色质区域,可以观察到一些变化,最明显的是该区域对核酸酶介导的DNA降解的敏感性增强。在具有转录活性区域的一些DNA序列对DNA酶I的敏感性特别高,因此称为DNA酶I的高敏感区(hypersensitive sites),这部分DNA序列一般在100至200 bp,常位于被转录基因5’端1000 bp范围之内。许多高敏感区和一些与基因表达有关的调控蛋白与DNA结合的区域是一致的,这些区域一般不存在核小体结构。
具有转录活性的染色质区域缺乏组蛋白H1,其他组蛋白成分常发生乙酰化(acetylation),或有一种叫泛素(ubiquitin)的蛋白质附着。
具有转录活性的染色质区域的DNA通常是去甲基化的。启动子附近DNA序列的甲基化可以抑制转录起始,与基因静止相关。甲基化一般发生在具有CpG序列的胞嘧啶第5位碳原子上。DNA甲基化的异常与肿瘤发生密切相关。
上述这些具有转录活性的染色质结构的改变,都是为转录的启动作准备,使RNA聚合酶和一些转录因子得以接近被转录基因的调控序列。基因活化的过程是染色质与转录相关的结构改变的过程,此过程称为染色质重建(chromatin remodeling)。
二、参与基因调控的顺式作用元件和反式作用因子
(一)顺式作用元件
这类调控元件是指那些和被转录的结构基因在距离上比较接近的DNA序列,包括启动子(及启动子上游近侧序列)及增强子等。
1.启动子和启动子上游近侧序列 编码蛋白质基因的启动子和启动子上游近侧序列中有3种短序列的突变能导致启动子功能的丧失,这3种短序列分别是TATA盒、CAAT盒、GC盒(已在第十三章作初步介绍)。启动子及启动子近侧的保守序列元件按它们对RNA聚合酶的影响,可分为两类,一类是位于较上游的元件,能较强地影响转录起始的效率,CAAT盒和GC盒即属于这类顺式元件;另一类是位于距转录起始点较近的TATA盒,在选择转录起始点的过程中起调控作用。
2.增强子 增强子是一类能增强真核细胞某些启动子功能的顺式作用元件。增强子作用不受序列方向的制约,即顺的和反的序列都有作用,而且在离启动子相对较远的上游或下游都能发挥作用,有的增强子位于基因中间(通常位于内含子中)。有的增强子只能在特异的组织中作用,例如免疫球蛋白基因的增强子(Oct-2)只能在表达该基因的B淋巴细胞中发挥作用,这种具有组织特异性的增强子可能是作为某些特异基因表达调控网络的组成部分而发挥作用。
3.反应元件(response elements) 当真核细胞处于某一特定环境时,有反应的基因具有相同的顺式作用元件,这类顺式元件称为反应元件。例如热激反应元件(HSE)、激素反应元件(HRE,在第十六章将作较深入介绍),金属反应元件(MRE)等。这些反应元件一般具有较短的保守序列,与转录起始点的距离不固定,一般在200 bp之内。有些反应元件在启动子或增强子内,如HSE在启动子内,糖皮质激素反应元件(GRE)在增强子内。
(二)反式作用因子
反式作用因子(简称反式因子),也称转录因子(transcription factors),是一类在细胞核内发挥作用的蛋白质因子。反式因子的作用特点是:①能识别启动子、启动子近侧元件和增强子等顺式元件中的特异靶序列,如转录因子TFⅡD能识别和结合TATA盒,转录因子Spl能识别和结合GC盒,CTFl能识别和结合CAAT盒(图15-9)。RNA聚合酶本身不能有效地启动或不能启动转录,只有当反式因子与相应的顺式元件结合后才能启动或有效启动转录。这种对基因转录启动的调控是通过结合在不同顺式元件上的反式因子之间或反式因子与RNA聚合酶之间的相互作用而实现的。
反式因子具有两个必需的结构域,一个是能与顺式元件结合的结构域,能识别特异的DNA序列;另一个是激活结构域,其功能是与其他反式因子或RNA聚合酶结合,正是由于反式因子激活结构域的这种功能,才能使一些离TATA盒较远(几个kb)的顺式元件所结合的反式因子能参与转录起始的调控。由于DNA分子是柔性的,能成环状,这是结合在相距较远的顺式元件上的反式因子之间相互作用的基础。真核生物基因转录的启动由多个转录因子参与,而不同转录因子组合的相互作用能启动不同基因的转录。
(三)反式作用因子结构的模式
反式因子与相应顺式元件结合的结构域,可归纳为如下几种模式:
1.螺旋一转角一螺旋(helix-turn-helix) 具有这种结构模式的转录调控蛋白最初在原核生物中发现,如本章提到的CAP。
2.锌指(zinc fingers) 锌指结构含有约30个氨基酸残基,其中4个氨基酸残基(两个是半胱氨酸,两个是组氨酸,或4个都是半胱氨酸)以配位键与Zn2+相互作用(图15—10)。这种结构模式在多种真核转录因子的DNA结合结构域中存在,而且都具有多个相同的锌指,转录因子TFⅢA(与转录5S RNA基因有关)具有9个锌指,每个锌指都能与DNA双螺旋大沟结合(图15-11)
3.亮氨酸拉链(1eucine zippers) 这种结构是指在反式因子的一段肽链中每隔7个氨基酸残基就有一个亮氨酸残基出现,这段肽链所形成的(—螺旋就会出现一个由亮氨酸残基构成的疏水面,而另一面则是由亲水性氨基酸残基所构成的亲水面(图15-12)。由亮氨酸残基组成的疏水面即为亮氨酸拉链条,两个具有亮氨酸拉链条的反式因子,就能借疏水作用形成二聚体(图15-13),有些反式因子要形成二聚体后才能发挥作用,二聚体可以是同二聚体(homodimer,即由两个相同的反式因子组成),也可以是异二聚体(heterodimer,即由两个不同的反式因子组成)。亮氨酸拉链对二聚体的形成是必需的,但不直接参与和DNA的相互作用,参与和DNA结合的是“拉链”区以外的结构。
4.螺旋-环-螺旋(helix-loop-helix) 这种结构也和亮氨酸拉链一样与形成反式因子二聚体有关。控制多细胞生物体有关基因表达的反式因子往往具有这种结构。这种结构具有比较保守的含有50个氨基酸残基的肽段,既含有与DNA结合的结构,又含有形成二聚体的结构,这部分肽段能形成两个较短的(-螺旋,两个(-螺旋之间有一段能形成环状的肽链,(-螺旋是兼性,即具有疏水面和亲水面(上述亮氨酸拉链也是兼性(-螺旋)。两个具有螺旋-环-螺旋的反式因子能形成二聚体,二聚体的形成有利于反式因子的DNA结合结构域与DNA结合(图15—14)。
(四)反式作用因子的作用特点和规律
1.一种反式因子能与一种以上的顺式元件结合 真核生物的转录因子不像原核生物的调控蛋白与顺式调控元件的结合有高度的专一性,有些反式因子可以和同源性很小的顺式元件结合。
2.一种顺式元件能和一种以上的反式因子结合 与CAAT盒结合的反式因子有好几类,如CTF类反式因子,CP类反式因子等。多种反式因子识别同一顺式元件,能加强这些反式因子单独或协同调节基因表达的精确性和灵活性。
3.有些反式因子以二聚体或多聚体与顺式元件作用 反式因子二聚体形成的机制已在前文提及,二聚体以不同因子形成的异二聚体为主。
4。有些反式因子的活性通过化学修饰受到调节 有些反式因子激活基因转录的活性,是在磷酸化后才具有的。
5.有些反式因子之间的相互作用对它们发挥功能是必需的 在RNA聚合酶Ⅱ发挥转录作用时,几种转录因子如TFⅡA、TFⅡB、TFⅡD、TFⅡE的相互作用是必需的,几种反式因子和RNA聚合酶Ⅱ按一定的时间和空间顺序,形成具有活性的转录起始复合物。