第七讲 真核基因表达调控
? 真核基因表达调控的最显著特征是能在特定时间和
特定的细胞中激活特定的基因,从而实现,预定,的、
有序的、不可逆转的分化、发育过程,并使生物的
组织和器官在一定的环境条件范围内保持正常功能。
? 原核生物的调控系统就是要在一个特定的环境中为
细胞创造高速生长的条件,或使细胞在受到损伤时,
尽快得到修复,所以,原核生物基因表达的开关经
常是通过控制转录的起始来调节的。
真核生物基因调控,根据其性质可分为两大类:
第一类是瞬时调控或称可逆性调控,它相当
于原核细胞对环境条件变化所做出的反应,包括
某种底物或激素水平升降及细胞周期不同阶段中
酶活性和浓度的调节。
第二类是发育调控或称不可逆调控,是真核
基因调控的精髓部分,它决定了真核细胞生长、
分化、发育的全部进程。
转录水平调控( transcriptional
regulation);
转录后水平调控( post transcriptional
regulation);
翻译水平调控 ( translational regulation);
蛋白质加工水平的调控 ( regulation of
protein maturation) 等。
研究基因调控主要应回答 3个问题:
① 什么是诱发基因转录的信号?
② 基因调控主要是在哪一步(模板 DNA的
转录,mRNA的成熟或蛋白质合成)实现的?
③ 不同水平基因调控的分子机制是什么?
一,真核基因组的一般构造特点
① 在真核细胞中,一条成熟的 mRNA链只能翻译
出一条多肽链,不存在原核生物中常见的多基因
操纵子形式。
② 真核细胞 DNA都与组蛋白和大量非组蛋白相结
合,只有一小部分 DNA是裸露的。
③ 高等真核细胞 DNA中很大部分是不转录的,大
部分真核细胞的基因中间还存在不被翻译的内含
子。
④ 真核生物能够有序地根据生长发育阶段的需要
进行 DNA片段重排,还能在需要时增加细胞内某
些基因的拷贝数。
⑤ 在真核生物中,基因转录的调节区相对较大,
它们可能远离启动子达几百个甚至上千个碱基对,
这些调节区一般通过改变整个所控制基因 5'上游
区 DNA构型来影响它与 RNA聚合酶的结合能力。
在原核生物中,转录的调节区都很小,大都位于
启动子上游不远处,调控蛋白结合到调节位点上
可直接促进或抑 RNA聚合酶与它的结合。
⑥ 真核生物的 RNA在细胞核中合成,只有经转运
穿过核膜,到达细胞质后,才能被翻译成蛋白质,
原核生物中不存在这样严格的空间间隔。
⑦ 许多真核生物的基因只有经过复杂的成熟和剪
接过程( maturation and splicing),才能顺利地
翻译成蛋白质。
二,真核基因的启动子
启动子是一段特定的直接与 RNA聚合
酶及其转录因子相结合、决定基因转录起
始与否的 DNA序列。不同的启动子对 RNA
聚合酶的亲和力不同,所结合的反式作用
因子( trans-acting factors)也不同,因此,
基因转录活性也很不相同。
Ⅰ,典型的原核启动子有四大要素,
转录起始位点,-10区,-35区和 -10区与 -35区之间
的间隔。
原核基因转录起始位点通常是嘌呤,其序列为
CAT( A为起始位点)。
-10区是一个 6碱基保守序列(常以 -10为中心)。
T80A95t45A60A50T96,有助于 DNA的解链。
-35区是另一个 6碱基保守序列(常以 -35为中心)。
T82T84G78A65C54a45
研究表明,当 -10区和 -35区中心位置相距 16-18bp
时,该启动子的功能较强;相距较近或较远时,起始
转录的功能都相应减弱。
Ⅱ,真核基因启动子
真核生物有 3类 RNA聚合酶,负责转录 3类不同的启动子。
由 RNA聚合酶 I负责转录的 rRNA基因,启动子( I类)
比较单一,由转录起始位点附近的两部分序列构成。第一
部分是核心启动子( core promoter),由 -45—+20位核
苷酸组成,单独存在时就足以起始转录。另一部分由 -
170—-107位序列组成,称为上游调控元件,能有效地增
强转录效率。
由 RNA聚合酶 Ⅲ 负责转录的是 5SrRNA,tRNA和某
些核内小分子 RNA( snRNA),其启动子( Ⅲ 类)组成
较复杂,又可被分为三个亚类。两类 5S rRNA和 tRNA基
因的启动子是内部启动子( internal promoter),位于转
录起始位点的下游,都由两部分组成。第三类启动子由三
个部分组成,位于转录起始位点上游。
? 由 RNA聚合酶 II负责转录的 II类基因包括所有蛋白质编码基因和部分
snRNA基因,后者的启动子结构与 III类基因启动子中的第三种类型
相似,编码蛋白质的 II类基因启动子在结构上有共同的保守序列。
转录起始位点没有广泛的序列同源性,但第一个碱基为腺嘌呤,而
两侧是嘧啶碱基。这个区域被称为起始子( initiator,Inr),序列
可表示为 Py2CAPy5。 Inr元件位于 -3—+5。仅由 Inr元件组成的启动
子是具有可被 RNA聚合酶 II识别的最简单启动子形式。
? 多数 II类启动子有一个被称为 TATA盒的共有序列,通常处于 -30区,
相对于转录起始位点的位置比较固定。 TATA盒存在于所有真核生物
中,TATA盒是一个保守的七碱基对,其序列为:
? 也有一些 II类启动子不含有 TATA盒,这样的启动子称
为无 TATA盒启动子。
三,增强子及其对转录的影响
增强子是指能使和它连锁的基因转录频率明显
增加的 DNA序列。作为基因表达的重要调节元件,
增强子通常具有下列性质:
1、增强效应十分明显,一般能使基因转录频率增
加 10-200倍。经人巨大细胞病毒增强子增强后的
珠蛋白基因表达频率比该基因正常转录高 600-
1000倍 !
2、增强效应与其位置和取向无关,不论增强子以
什么方向排列( 5'→3' 或 3'→5' ),甚至和基因相
距 3 kp,或在基因下游,均表现出增强效应;
? 3、大多为重复序列,一般长约 50bp,适合与某
些蛋白因子结合。其内部常含有一个核心序列:
( G) TGGA/TA/TA/T( G),是产生增强效应时
所必需的;
4,增强效应有严密的组织和细胞特异性,说明
只有特定的蛋白质(转录因子)参与才能发挥其
功能;
5,没有基因专一性,可以在不同的基因组合上
表现增强效应;
6,许多增强子还受外部信号的调控,如金属硫
蛋白的基因启动区上游所带的增强子,就可以对
环境中的锌、镉浓度做出反应。
? 增强子的作用原理是什么呢?一种观点认为,增强子
为转录因子提供进入启动子区的位点。第二种认为,
增强子能改变染色质的构象。因为增强子区域容易发
生从 B-DNA到 Z-DNA的构象变化。
? 增强子的功能是可以累加的。 SV40增强子序列可以
被分为两半,每一半序列本身作为增强子功能很弱,
但合在一起,即使其中间插入一些别的序列,仍然是
一个有效的增强子。因此,要使一个增强子失活必须
在多个位点上造成突变。对 SV40增强子而言,没有
任何单个的突变可以使其活力降低 10倍。
? 四,反式作用因子对转录的影响
真核生物启动子和增强子是由若干可以
区分的 DNA序列组成的,由于它们和特定
的功能基因连锁在一起,因此称为顺式作
用元件。真核生物转录调控大多是通过顺
式作用元件和反式作用因子复杂的相互作
用而实现的,下面介绍的是与顺式作用成
分专一性结合的一些转录因子。一般认为,
如果某个蛋白是体外转录系统中起始 RNA
合成所必需的,它就是转录复合体的一部
分。根据各个蛋白质成分在转录中的作用,
能将整个复合体分为 3部分:
? ① 参与所有或某些转录阶段的 RNA聚合酶
亚基,不具有基因特异性。
② 与转录的起始或终止有关的辅助因子,
也不具有基因特异性。
③ 与特异调控序列结合的转录因子。它们
中有些被认为是转录复合体的一部分,因
为所有或大部分基因的启动子区含有这一
特异序列,如 TATA区和 TFIID,更多的则
是基因或启动子特异性结合调控蛋白,它
们是起始某个(类)基因转录所必需的。
? 1,DNA结合结构域基序
a,Helix-turn-helix(螺
旋 -转角 -螺旋)。是最早发
现于原核生物中的一个关键
因子,该结构域长约 20个 aa,
主要是两个 α-螺旋区和将其
隔开的 β转角。其中的一个被
称为识别螺旋区,因为它常
常带有数个直接与 DNA序列
相识别的氨基酸。
? b,Zinc finger(锌指)。
长约 30个 aa,其中 4个
氨基酸( Cys或 2个
Cys,两个 His)与一
个 Zinc原子相结合。
与 Zinc结合后锌指结
构较稳定。
? c,Homeodomain(同
源域),最早来自控
制躯体发育的基因,
长约 60个氨基酸,其
中的 DNA结合区与
helix-turn-helix motif
相似,人们把该 DNA
序列称为 homeobox。
主要与 DNA大沟相结
合。
? d,Leucine zippers(亮氨
酸拉链)
是亲脂性( amphipathic)
的 α螺旋,包含有许多集
中在螺旋一边的疏水氨基
酸,两条多肽链以此形成
二聚体。每隔 6个残基出
现一个亮氨酸。由赖氨酸
( Lys)和精氨酸( Arg)
组成 DNA结合区。
? e,碱性螺旋 --环 --螺旋
( basic helix-loop-helix)
该调控区长约 50个 aa残基,
同时具有 DNA结合和形成
蛋白质二聚体的功能,其
主要特点是可形成两个亲
脂性 α-螺旋,两个螺旋之
间由环状结构相连,其
DNA结合功能是由一个较
短的富碱性氨基酸区所决
定的。
2,DNA结合蛋白主要转录激活结构域
? 转录激活结构域( transcription activation
domains)一般由 20-100个氨基酸残基组成。如
GAL4分子中有 2个这种结构域,分别位于多肽链
的第 147-196位和第 768-881位; GCN4的转录激
活结构域位于多肽链的第 106-125位。
? a,酸性 α-螺旋 (acidic α-helix)
该结构域含有由酸性氨基酸残基组成的保守序列,
多呈带负电荷的亲脂性 α-螺旋,包含这种结构域
的转录因子有 GAL4,GCN4、糖皮质激素受体和
AP-1/Jun等。增加激活区的负电荷数能提高激活
转录的水平。可能是通过非特异性的相互作用与
转录起始复合物上的 TFIID等因子结合生成稳定的
转录复合物而促进转录。
? b,谷氨酰胺丰富区 (glutamine-rich domain)
SP1的 N末端含有 2个主要的转录激活区,
氨基酸组成中有 25%的谷氨酰胺,很少有
带电荷的氨基酸残基。酵母的 HAP1、
HAP2和 GAL2及哺乳动物的 OCT-1,OCT-
2,Jun,AP2和 SRF也含有这种结构域。
? C.脯氨酸丰富区 (proline-rich domain)
CTF家族(包括 CTF-1,CTF-2,CTF-3)
的 C末端与其转录激活功能有关,含有
20%-30%的脯氨酸残基。
? 3,与已知 DNA序列相结合的反式作用因子
a,CAAT盒激活因子
CTF( CAAT box transcription factor)家族是
能识别 CAAT盒的一组转录因子。这一组因子是
由单个基因通过可变换的剪接而形成的一组
mRNA产生的。 CTF家族成员对各种 CAAT盒有相
同的亲和力。另一组 CAAT区结合蛋白被称为 CP,
它们是从人的 HeLa细胞中得到的。 CP1具有对 α-
球蛋白和腺病毒晚期基因启动子 CAAT区的高亲
和力,CP2具有对 γ-血纤蛋白原基因启动子 CAAT
区的高亲和力,而 CP3能与腺病毒 DNA相结合。
CP族蛋白主要以异源多聚体的形式存在。
? 除了 CTF和 CP族蛋白能与 CAAT区结合外,科学
家还从小鼠肝细胞里发现两个 CAAT区结合蛋白。
CBP对序列 GCAAT有较强的亲和力,而 ACF则对
卵清蛋白基因启动子区的 CCAAT有高亲和力。因
此,在启动区发现某个保守序列,并不等于同一
个蛋白因子参与了该基因的调控。
? 对 9个哺乳动物类 β-球蛋白基因和 1个人 α-球
蛋白基因 5'调控区的研究发现,几乎每个基
因都具有 CCAAT( -80位左右)区和 TATA
( -30左右)区。
? b,TATA区结合蛋白
RNA聚合酶 II需要与
其他转录因子结合,才能
顺利起始转录。通常把辅
助因子需要量最小的启动
子称为一般性启动子
( generic promoter),
具有组成型表达特性,这
些启动子上游调控区及所
需转录因子在绝大多数甚
至全部基因中都是高度保
守的。
TBP结合于 DNA的小沟。 TBP与 DNA的结合在体外实验中保护
了大约一圈双螺旋 DNA免受核酸酶的降解,其覆盖的位置处于
-37~ -25。 TAFs的加入延伸了对 DNA的覆盖,整个 TFIID复合
物可覆盖 -45~ -10区域。
? C,GC区结合因子
GC区结合蛋白 SP1是 1.0x105的单体,能与
DNA链上包括 GGGCGG在内约 20bp的序列特异
结合。在 SV40启动子区,从 -70~ -110的 6个 GC
区全部与 SP1结合,所以这个区域的 DNA不会被
降解。在胸腺嘧啶激酶启动子区,SP1既与上游
的 CTF( CAAT区结合蛋白)相互作用,又与下游
的 TFIID紧密相关。
GC区对 SP1的结合是必需的,但该序列对于
SP1亲和力却很不相同,证明 GC区两翼序列同样
在 SP1的识别及结合过程中发挥作用。人们推测
GC区、尤其是多次重复的 GC区,与基因的永久
型表达有关。
? d,八碱基对元件激活
蛋白
八碱基对元件也
能被多个激活蛋白识
别。 Oct-1是非淋巴样
细胞中结合八碱基对
元件的转录激活因子,
没有组织特异性。
Oct-2则是组织特异的
激活因子。
一般说来,一个
特定的共有序列元件
能被相应的转录因子
或一个转录因子家族
的成员所识别,而相
同的元件也能被不同
的转录因子所识别。
? 五、真核基因转录后加工的多样性
1.简单转录单位
? 2,复杂转录单位
含有复杂转录单位
的主要是一些编码组
织和发育特异性蛋白
质的基因,它们除了
含有数量不等的内含
子以外,其初级转录
产物能通过多种不同
方式加工成两个或两
个以上的 mRNA。
? 利用多个加 poly( A)位点和不同的剪接方式产生不同的蛋白质。
这类基因 5'末端虽只有一个转录起始位点,但有两个或多个加
poly( A)位点,因此可通过不同的剪接方式得到不同的蛋白质。
3,mRNA稳定性控制
? 真核生物能否长时间、及时地利用成熟的 mRNA分子翻译出蛋
白质以供生长、发育的需要,是和 mRNA的稳定性以及屏蔽状
态的解除相关的。
? 原核生物 mRNA的半衰期很短,平均大约 3min。高等真核生物
迅速生长的细胞中 mRNA的半衰期平均 3h。在高度分化的终端
细胞中许多 mRNA极其稳定,有的寿命长达数天。
? 转运铁蛋白受体( TfR)和铁蛋白负责铁吸收和铁解毒。这两
个 mRNA上存在相似的顺式作用元件,称为铁应答元件( iron
response element,IRE)。 IRE与 IRE结合蛋白( IREBP)相
互作用控制了这两个 mRNA的翻译效率。当细胞缺铁时,
IREBP与 IRE具有高亲和力,两者的结合有效地阻止了铁蛋白
mRNA的翻译,与此同时,TfR mRNA上 3'非翻译区中的 IRE也
与 IREBP特异结合,有效地阻止了 TfR mRNA的降解,促进 TfR
蛋白的合成。
4,蛋白质因子的修饰与翻译起始调控
? 用兔网织红细胞粗抽提液研究蛋白质合成时发现,如果不向这一体系中添
加氯高铁血红素,网织红细胞粗抽提液中的蛋白质合成抑制剂就被活化,
蛋白质合成活性在几分钟之内急剧下降,很快就彻底消失。现已查明,网
织红细胞蛋白质合成的抑制剂 HCI是受氯高铁血红素调节的 eIF-2的激酶,
可以使该因子的 α-亚基磷酸化并由活性型转变为非活性型。
六,真核基因表达调控举例
? 现代分子生物学上把能与某个(类)专一蛋白因
子结合,从而控制基因特异表达的 DNA上游序列
称为应答元件( response element)。它们与细
胞内高度专一的转录因子相互作用,协调相关基
因的转录。
? 最常见的应答元件有:
热激应答元件( heatshock response element,
HSE),
糖皮质应答元件( glucocorticoid response
element,GRE),
金属应答元件( metal response element,MRE)
七、真核基因表达研究方法与应用
1、基因敲除技术 (Gene Knockout)
注意事项:
( 1)、有合适的胚胎干细胞( embryonic
stem cells);
( 2)、有已知的单拷贝基因位点;
( 3)、用线性载体或不能自我复制的载体
2.蛋白质相互作用( Pull-
down assay) Science,
289:1550-1554 (2000)
? NFkB基因表达后导致
细胞炎症,而 NFkB基
因的活化受炎症诱发
因子的刺激。 IKKα、
IKKβ及 NEMO
( NFkB-essential
modifier)抑制 NFkB
基因的表达。
3、导弹药物 --药物导向治疗
? 肿瘤或癌细胞表面通常过量表达某些特征性蛋白
质(如人乳腺癌细胞表面的 28 kD 蛋白),可作
为肿瘤导向治疗的作用靶。将抗体的某些部分与
外毒素相连接,就可以把毒素直接送到病变细胞
表面,有效地杀死病变细胞,保护健康细胞。
? Cell,95:657-667 (1998); Nature,400:781-
784(1999);
Science,288:859-863 (2000); PNAS,In
Press (2000)。
? 真核基因表达调控的最显著特征是能在特定时间和
特定的细胞中激活特定的基因,从而实现,预定,的、
有序的、不可逆转的分化、发育过程,并使生物的
组织和器官在一定的环境条件范围内保持正常功能。
? 原核生物的调控系统就是要在一个特定的环境中为
细胞创造高速生长的条件,或使细胞在受到损伤时,
尽快得到修复,所以,原核生物基因表达的开关经
常是通过控制转录的起始来调节的。
真核生物基因调控,根据其性质可分为两大类:
第一类是瞬时调控或称可逆性调控,它相当
于原核细胞对环境条件变化所做出的反应,包括
某种底物或激素水平升降及细胞周期不同阶段中
酶活性和浓度的调节。
第二类是发育调控或称不可逆调控,是真核
基因调控的精髓部分,它决定了真核细胞生长、
分化、发育的全部进程。
转录水平调控( transcriptional
regulation);
转录后水平调控( post transcriptional
regulation);
翻译水平调控 ( translational regulation);
蛋白质加工水平的调控 ( regulation of
protein maturation) 等。
研究基因调控主要应回答 3个问题:
① 什么是诱发基因转录的信号?
② 基因调控主要是在哪一步(模板 DNA的
转录,mRNA的成熟或蛋白质合成)实现的?
③ 不同水平基因调控的分子机制是什么?
一,真核基因组的一般构造特点
① 在真核细胞中,一条成熟的 mRNA链只能翻译
出一条多肽链,不存在原核生物中常见的多基因
操纵子形式。
② 真核细胞 DNA都与组蛋白和大量非组蛋白相结
合,只有一小部分 DNA是裸露的。
③ 高等真核细胞 DNA中很大部分是不转录的,大
部分真核细胞的基因中间还存在不被翻译的内含
子。
④ 真核生物能够有序地根据生长发育阶段的需要
进行 DNA片段重排,还能在需要时增加细胞内某
些基因的拷贝数。
⑤ 在真核生物中,基因转录的调节区相对较大,
它们可能远离启动子达几百个甚至上千个碱基对,
这些调节区一般通过改变整个所控制基因 5'上游
区 DNA构型来影响它与 RNA聚合酶的结合能力。
在原核生物中,转录的调节区都很小,大都位于
启动子上游不远处,调控蛋白结合到调节位点上
可直接促进或抑 RNA聚合酶与它的结合。
⑥ 真核生物的 RNA在细胞核中合成,只有经转运
穿过核膜,到达细胞质后,才能被翻译成蛋白质,
原核生物中不存在这样严格的空间间隔。
⑦ 许多真核生物的基因只有经过复杂的成熟和剪
接过程( maturation and splicing),才能顺利地
翻译成蛋白质。
二,真核基因的启动子
启动子是一段特定的直接与 RNA聚合
酶及其转录因子相结合、决定基因转录起
始与否的 DNA序列。不同的启动子对 RNA
聚合酶的亲和力不同,所结合的反式作用
因子( trans-acting factors)也不同,因此,
基因转录活性也很不相同。
Ⅰ,典型的原核启动子有四大要素,
转录起始位点,-10区,-35区和 -10区与 -35区之间
的间隔。
原核基因转录起始位点通常是嘌呤,其序列为
CAT( A为起始位点)。
-10区是一个 6碱基保守序列(常以 -10为中心)。
T80A95t45A60A50T96,有助于 DNA的解链。
-35区是另一个 6碱基保守序列(常以 -35为中心)。
T82T84G78A65C54a45
研究表明,当 -10区和 -35区中心位置相距 16-18bp
时,该启动子的功能较强;相距较近或较远时,起始
转录的功能都相应减弱。
Ⅱ,真核基因启动子
真核生物有 3类 RNA聚合酶,负责转录 3类不同的启动子。
由 RNA聚合酶 I负责转录的 rRNA基因,启动子( I类)
比较单一,由转录起始位点附近的两部分序列构成。第一
部分是核心启动子( core promoter),由 -45—+20位核
苷酸组成,单独存在时就足以起始转录。另一部分由 -
170—-107位序列组成,称为上游调控元件,能有效地增
强转录效率。
由 RNA聚合酶 Ⅲ 负责转录的是 5SrRNA,tRNA和某
些核内小分子 RNA( snRNA),其启动子( Ⅲ 类)组成
较复杂,又可被分为三个亚类。两类 5S rRNA和 tRNA基
因的启动子是内部启动子( internal promoter),位于转
录起始位点的下游,都由两部分组成。第三类启动子由三
个部分组成,位于转录起始位点上游。
? 由 RNA聚合酶 II负责转录的 II类基因包括所有蛋白质编码基因和部分
snRNA基因,后者的启动子结构与 III类基因启动子中的第三种类型
相似,编码蛋白质的 II类基因启动子在结构上有共同的保守序列。
转录起始位点没有广泛的序列同源性,但第一个碱基为腺嘌呤,而
两侧是嘧啶碱基。这个区域被称为起始子( initiator,Inr),序列
可表示为 Py2CAPy5。 Inr元件位于 -3—+5。仅由 Inr元件组成的启动
子是具有可被 RNA聚合酶 II识别的最简单启动子形式。
? 多数 II类启动子有一个被称为 TATA盒的共有序列,通常处于 -30区,
相对于转录起始位点的位置比较固定。 TATA盒存在于所有真核生物
中,TATA盒是一个保守的七碱基对,其序列为:
? 也有一些 II类启动子不含有 TATA盒,这样的启动子称
为无 TATA盒启动子。
三,增强子及其对转录的影响
增强子是指能使和它连锁的基因转录频率明显
增加的 DNA序列。作为基因表达的重要调节元件,
增强子通常具有下列性质:
1、增强效应十分明显,一般能使基因转录频率增
加 10-200倍。经人巨大细胞病毒增强子增强后的
珠蛋白基因表达频率比该基因正常转录高 600-
1000倍 !
2、增强效应与其位置和取向无关,不论增强子以
什么方向排列( 5'→3' 或 3'→5' ),甚至和基因相
距 3 kp,或在基因下游,均表现出增强效应;
? 3、大多为重复序列,一般长约 50bp,适合与某
些蛋白因子结合。其内部常含有一个核心序列:
( G) TGGA/TA/TA/T( G),是产生增强效应时
所必需的;
4,增强效应有严密的组织和细胞特异性,说明
只有特定的蛋白质(转录因子)参与才能发挥其
功能;
5,没有基因专一性,可以在不同的基因组合上
表现增强效应;
6,许多增强子还受外部信号的调控,如金属硫
蛋白的基因启动区上游所带的增强子,就可以对
环境中的锌、镉浓度做出反应。
? 增强子的作用原理是什么呢?一种观点认为,增强子
为转录因子提供进入启动子区的位点。第二种认为,
增强子能改变染色质的构象。因为增强子区域容易发
生从 B-DNA到 Z-DNA的构象变化。
? 增强子的功能是可以累加的。 SV40增强子序列可以
被分为两半,每一半序列本身作为增强子功能很弱,
但合在一起,即使其中间插入一些别的序列,仍然是
一个有效的增强子。因此,要使一个增强子失活必须
在多个位点上造成突变。对 SV40增强子而言,没有
任何单个的突变可以使其活力降低 10倍。
? 四,反式作用因子对转录的影响
真核生物启动子和增强子是由若干可以
区分的 DNA序列组成的,由于它们和特定
的功能基因连锁在一起,因此称为顺式作
用元件。真核生物转录调控大多是通过顺
式作用元件和反式作用因子复杂的相互作
用而实现的,下面介绍的是与顺式作用成
分专一性结合的一些转录因子。一般认为,
如果某个蛋白是体外转录系统中起始 RNA
合成所必需的,它就是转录复合体的一部
分。根据各个蛋白质成分在转录中的作用,
能将整个复合体分为 3部分:
? ① 参与所有或某些转录阶段的 RNA聚合酶
亚基,不具有基因特异性。
② 与转录的起始或终止有关的辅助因子,
也不具有基因特异性。
③ 与特异调控序列结合的转录因子。它们
中有些被认为是转录复合体的一部分,因
为所有或大部分基因的启动子区含有这一
特异序列,如 TATA区和 TFIID,更多的则
是基因或启动子特异性结合调控蛋白,它
们是起始某个(类)基因转录所必需的。
? 1,DNA结合结构域基序
a,Helix-turn-helix(螺
旋 -转角 -螺旋)。是最早发
现于原核生物中的一个关键
因子,该结构域长约 20个 aa,
主要是两个 α-螺旋区和将其
隔开的 β转角。其中的一个被
称为识别螺旋区,因为它常
常带有数个直接与 DNA序列
相识别的氨基酸。
? b,Zinc finger(锌指)。
长约 30个 aa,其中 4个
氨基酸( Cys或 2个
Cys,两个 His)与一
个 Zinc原子相结合。
与 Zinc结合后锌指结
构较稳定。
? c,Homeodomain(同
源域),最早来自控
制躯体发育的基因,
长约 60个氨基酸,其
中的 DNA结合区与
helix-turn-helix motif
相似,人们把该 DNA
序列称为 homeobox。
主要与 DNA大沟相结
合。
? d,Leucine zippers(亮氨
酸拉链)
是亲脂性( amphipathic)
的 α螺旋,包含有许多集
中在螺旋一边的疏水氨基
酸,两条多肽链以此形成
二聚体。每隔 6个残基出
现一个亮氨酸。由赖氨酸
( Lys)和精氨酸( Arg)
组成 DNA结合区。
? e,碱性螺旋 --环 --螺旋
( basic helix-loop-helix)
该调控区长约 50个 aa残基,
同时具有 DNA结合和形成
蛋白质二聚体的功能,其
主要特点是可形成两个亲
脂性 α-螺旋,两个螺旋之
间由环状结构相连,其
DNA结合功能是由一个较
短的富碱性氨基酸区所决
定的。
2,DNA结合蛋白主要转录激活结构域
? 转录激活结构域( transcription activation
domains)一般由 20-100个氨基酸残基组成。如
GAL4分子中有 2个这种结构域,分别位于多肽链
的第 147-196位和第 768-881位; GCN4的转录激
活结构域位于多肽链的第 106-125位。
? a,酸性 α-螺旋 (acidic α-helix)
该结构域含有由酸性氨基酸残基组成的保守序列,
多呈带负电荷的亲脂性 α-螺旋,包含这种结构域
的转录因子有 GAL4,GCN4、糖皮质激素受体和
AP-1/Jun等。增加激活区的负电荷数能提高激活
转录的水平。可能是通过非特异性的相互作用与
转录起始复合物上的 TFIID等因子结合生成稳定的
转录复合物而促进转录。
? b,谷氨酰胺丰富区 (glutamine-rich domain)
SP1的 N末端含有 2个主要的转录激活区,
氨基酸组成中有 25%的谷氨酰胺,很少有
带电荷的氨基酸残基。酵母的 HAP1、
HAP2和 GAL2及哺乳动物的 OCT-1,OCT-
2,Jun,AP2和 SRF也含有这种结构域。
? C.脯氨酸丰富区 (proline-rich domain)
CTF家族(包括 CTF-1,CTF-2,CTF-3)
的 C末端与其转录激活功能有关,含有
20%-30%的脯氨酸残基。
? 3,与已知 DNA序列相结合的反式作用因子
a,CAAT盒激活因子
CTF( CAAT box transcription factor)家族是
能识别 CAAT盒的一组转录因子。这一组因子是
由单个基因通过可变换的剪接而形成的一组
mRNA产生的。 CTF家族成员对各种 CAAT盒有相
同的亲和力。另一组 CAAT区结合蛋白被称为 CP,
它们是从人的 HeLa细胞中得到的。 CP1具有对 α-
球蛋白和腺病毒晚期基因启动子 CAAT区的高亲
和力,CP2具有对 γ-血纤蛋白原基因启动子 CAAT
区的高亲和力,而 CP3能与腺病毒 DNA相结合。
CP族蛋白主要以异源多聚体的形式存在。
? 除了 CTF和 CP族蛋白能与 CAAT区结合外,科学
家还从小鼠肝细胞里发现两个 CAAT区结合蛋白。
CBP对序列 GCAAT有较强的亲和力,而 ACF则对
卵清蛋白基因启动子区的 CCAAT有高亲和力。因
此,在启动区发现某个保守序列,并不等于同一
个蛋白因子参与了该基因的调控。
? 对 9个哺乳动物类 β-球蛋白基因和 1个人 α-球
蛋白基因 5'调控区的研究发现,几乎每个基
因都具有 CCAAT( -80位左右)区和 TATA
( -30左右)区。
? b,TATA区结合蛋白
RNA聚合酶 II需要与
其他转录因子结合,才能
顺利起始转录。通常把辅
助因子需要量最小的启动
子称为一般性启动子
( generic promoter),
具有组成型表达特性,这
些启动子上游调控区及所
需转录因子在绝大多数甚
至全部基因中都是高度保
守的。
TBP结合于 DNA的小沟。 TBP与 DNA的结合在体外实验中保护
了大约一圈双螺旋 DNA免受核酸酶的降解,其覆盖的位置处于
-37~ -25。 TAFs的加入延伸了对 DNA的覆盖,整个 TFIID复合
物可覆盖 -45~ -10区域。
? C,GC区结合因子
GC区结合蛋白 SP1是 1.0x105的单体,能与
DNA链上包括 GGGCGG在内约 20bp的序列特异
结合。在 SV40启动子区,从 -70~ -110的 6个 GC
区全部与 SP1结合,所以这个区域的 DNA不会被
降解。在胸腺嘧啶激酶启动子区,SP1既与上游
的 CTF( CAAT区结合蛋白)相互作用,又与下游
的 TFIID紧密相关。
GC区对 SP1的结合是必需的,但该序列对于
SP1亲和力却很不相同,证明 GC区两翼序列同样
在 SP1的识别及结合过程中发挥作用。人们推测
GC区、尤其是多次重复的 GC区,与基因的永久
型表达有关。
? d,八碱基对元件激活
蛋白
八碱基对元件也
能被多个激活蛋白识
别。 Oct-1是非淋巴样
细胞中结合八碱基对
元件的转录激活因子,
没有组织特异性。
Oct-2则是组织特异的
激活因子。
一般说来,一个
特定的共有序列元件
能被相应的转录因子
或一个转录因子家族
的成员所识别,而相
同的元件也能被不同
的转录因子所识别。
? 五、真核基因转录后加工的多样性
1.简单转录单位
? 2,复杂转录单位
含有复杂转录单位
的主要是一些编码组
织和发育特异性蛋白
质的基因,它们除了
含有数量不等的内含
子以外,其初级转录
产物能通过多种不同
方式加工成两个或两
个以上的 mRNA。
? 利用多个加 poly( A)位点和不同的剪接方式产生不同的蛋白质。
这类基因 5'末端虽只有一个转录起始位点,但有两个或多个加
poly( A)位点,因此可通过不同的剪接方式得到不同的蛋白质。
3,mRNA稳定性控制
? 真核生物能否长时间、及时地利用成熟的 mRNA分子翻译出蛋
白质以供生长、发育的需要,是和 mRNA的稳定性以及屏蔽状
态的解除相关的。
? 原核生物 mRNA的半衰期很短,平均大约 3min。高等真核生物
迅速生长的细胞中 mRNA的半衰期平均 3h。在高度分化的终端
细胞中许多 mRNA极其稳定,有的寿命长达数天。
? 转运铁蛋白受体( TfR)和铁蛋白负责铁吸收和铁解毒。这两
个 mRNA上存在相似的顺式作用元件,称为铁应答元件( iron
response element,IRE)。 IRE与 IRE结合蛋白( IREBP)相
互作用控制了这两个 mRNA的翻译效率。当细胞缺铁时,
IREBP与 IRE具有高亲和力,两者的结合有效地阻止了铁蛋白
mRNA的翻译,与此同时,TfR mRNA上 3'非翻译区中的 IRE也
与 IREBP特异结合,有效地阻止了 TfR mRNA的降解,促进 TfR
蛋白的合成。
4,蛋白质因子的修饰与翻译起始调控
? 用兔网织红细胞粗抽提液研究蛋白质合成时发现,如果不向这一体系中添
加氯高铁血红素,网织红细胞粗抽提液中的蛋白质合成抑制剂就被活化,
蛋白质合成活性在几分钟之内急剧下降,很快就彻底消失。现已查明,网
织红细胞蛋白质合成的抑制剂 HCI是受氯高铁血红素调节的 eIF-2的激酶,
可以使该因子的 α-亚基磷酸化并由活性型转变为非活性型。
六,真核基因表达调控举例
? 现代分子生物学上把能与某个(类)专一蛋白因
子结合,从而控制基因特异表达的 DNA上游序列
称为应答元件( response element)。它们与细
胞内高度专一的转录因子相互作用,协调相关基
因的转录。
? 最常见的应答元件有:
热激应答元件( heatshock response element,
HSE),
糖皮质应答元件( glucocorticoid response
element,GRE),
金属应答元件( metal response element,MRE)
七、真核基因表达研究方法与应用
1、基因敲除技术 (Gene Knockout)
注意事项:
( 1)、有合适的胚胎干细胞( embryonic
stem cells);
( 2)、有已知的单拷贝基因位点;
( 3)、用线性载体或不能自我复制的载体
2.蛋白质相互作用( Pull-
down assay) Science,
289:1550-1554 (2000)
? NFkB基因表达后导致
细胞炎症,而 NFkB基
因的活化受炎症诱发
因子的刺激。 IKKα、
IKKβ及 NEMO
( NFkB-essential
modifier)抑制 NFkB
基因的表达。
3、导弹药物 --药物导向治疗
? 肿瘤或癌细胞表面通常过量表达某些特征性蛋白
质(如人乳腺癌细胞表面的 28 kD 蛋白),可作
为肿瘤导向治疗的作用靶。将抗体的某些部分与
外毒素相连接,就可以把毒素直接送到病变细胞
表面,有效地杀死病变细胞,保护健康细胞。
? Cell,95:657-667 (1998); Nature,400:781-
784(1999);
Science,288:859-863 (2000); PNAS,In
Press (2000)。