第十四章 基因的表达与调控
第一节 原核基因转录的启动与终止
一、启动子
启动子 ( promoter),转录的起始和链的选择信号的DN
A核苷酸顺序就称为启动子, 这个位点也是RNA聚合酶
的结合起点 。
?启动子的结构:1975年 Pribnow采用保护法先后测定
了包括T4噬菌体及 E.coli在内的 46个不同来源基因的R
NA聚合酶的保护区域, 发现发现保护区段长度为
41~44bp,范围在 -20~+20之间, 分析这一序列发现在-1
0区有一保守顺序:
T40A41T25A29A30T46G17/46
89 89 50 65 65 100 37%
这一顺序称为 -10区 或 pribnow顺序 ( pribnow box)。
附:保护法:将 DNA与 RNA聚合酶结合后,加入
DNase I水解后得到的不被水解的保护片段。
Shall利用保护法得到的 DNA片段提纯后,加入
RNA聚合酶发现 RNA聚合酶不能与 DNA片段结合,
说明在被保护的 41~44bp的 DNA区段外还有与 RNA
聚合酶结合有关的序列。因此他采用较温和的核酸
外切酶( S1核酸酶)及 足迹法 进行分析,发现被
保护的区域有 60bp( -40~+20),在 -35区还有一段
保守序列:
T38T37G35A27C29A26/46
85 83 81 61 69 52 %
这一序列称为 -35区 或 sextama顺序 ( Sextama box).
附:足迹法( foot printing):用于分析蛋白质与
DNA结合的一种常用方法。
蛋白质结合位点 1
蛋白质结合位点 2
从左到右蛋白质浓度增加
整个启动子应包括 -10和 -35两个区域。
说明:
?这两个区域的顺序来自于 E.coli,它并不代表所有原
核生物。
?定点突变的结果表明,启动子的作用是整个区域
而不是单个核苷酸,但单个核苷酸的突变会导致转
录水平的上升或下降,特别是 A/T突变为 G/C下降
更明显。
?启动子的功能:是 RNA聚合酶结合的位点,决定
转录的起始位点及链的选择。 -10区是核心酶结合
的位点,-35区是 ζ因子结合的位点。
?CRP结合位点 ( cAMP reception protein binding site)
原核生物的基因上游除了含有启动子外, 在某些
编码 分解代谢的操纵子 前面还有一些与某种调节因
子相结合的位点, 从而对基因的表达起调控作用 。
其中研究得较多的是 E.coli乳糖操纵子与 cAMP受体
蛋白的结合位点, 这个位点也称为 CAP 位点
( catabolite gene activation protein site), 位于 -50~
-70之间, 含有两小段回文对称结构:
C AAT TAAT GTGAG TTAG CTCA
C TC ATT A
二、起录点,SD顺序及起译点
?起录点,所谓的起录点是指转录的起始点。这一
位点位于启动子 -10区的下游 10bp处,原核生物基
因起录点附近的三个核苷酸,大多数基因是 CAT,
所以在原核生物中也常用 CAT表示起录点。但并不
是绝对的,有时会有变化,如 CAC,TAC等。一般
来说,起录点可用 PyA/gPu表示( A/g表示大多数
情况下是A,少数情况下是G)。转录就是从 A/g
位点开始。
?翻译识别点 ( SD顺序 ),这一位点是核糖体识别并与
mRNA结合的位点 。 在每个基因起始点的下游都有一小段
富含嘌呤的顺序与 5’AGGAGG3’ 。 这一顺序可与核糖体
30S亚基上的 16S rRNA的3 ’ 末端富含嘧啶的顺序
5 ’ CCUCCU3 ’ 互补, 这一顺序就称为 Shine-Dalgarno
( SD顺序 ) 。
典型的 SD顺序是 AGGAGG,但事实上在这 6bp中, 只
要有连续的3个以上 bp与 CCUCCU互补, 便可作为核糖体
的识别顺序, 但是 SD的长度会直接影响mRNA与核糖
体结合的紧密度, 从而影响翻译效率 。
SD顺序位于起录点下游, 起译点上游, 距起译点5
-16 bp,而与 CAT的距离变化较大 。
?起译点,所谓的起译点就是翻译的起始位点 。 在原核生
物中一般是ATG, 极少数是GTG, 编码fMet 。
三, 转录的终止
’ 末端往往有一段特定的,
有终止转录作用的顺序, 这段顺序称为转录终止子,
简称终止子 ( terminator) 。
?终止子的结构,1975年 Rosenberg分析了原核生物
和噬菌体的20个基因的顺序发现在终止部位上游
20± 4bp处都有一小段反向重复序列 ( 回文序列 ),
从而使转录出为的RNA具有特定的颈环结构 。 这
一结构对终止转录起着决定性作用 。
?,
把终止子分为不依赖 ρ蛋白的终止子 ( 即强终止子 )
和依赖于 ρ的终止子 ( 弱终止子 ) 。
强终止子与弱终止子在结构上的区别在于强终
止子在回文区内富含 G/C对而回文区的下游区有
6~8对 A/T对 。 相反, 弱终止子在回文区内 G/C对含
量较少, 下游区 A/T对含量较少 。
根据终止子所处的位置, 可以把终止子分为存
在于基因末端的终止子和存在于基因内部的终止子
( 弱化子 ) 。
以上几类终止子的终止作用大都发生在离反向
重复顺序的对称中心下游20bp处 。









子——




噬菌体 λ的
TR1终止
子 ——弱终
止子。
?终止子的作用机制:终止子的作用机制的详细情
况还不清楚, 现在一般认为, 当RNA链转录到终
止信号时, 在RNA链上可形成颈一环结构从而诱
导终止作用的产生, 在终止作用过程中还有一些辅
助蛋白如 ρ蛋白 。
CAT SD ATG TGA Ter
-35 -10 +1
上游
Leader sequence 转录区
编码区
单顺反子转录单位
CAT SD ATG TGA ATG TGA TerCRP -35 -10 +1
上游
Leader sequence 转录区
编码区 编码区
下游
下游多顺反子转录单位
四、总结
第二节 原核基因转录的启动与终止
真核生物有三种 RNA聚合酶分别识别不同的启
动子,其中 RNA pol I位于核仁,负责转录 rRNA;
RNA pol II位于核质,负责转录 mRNA; RNA pol
III位于核质,负责转录 tRNA及 5s rRNA。这里主要
介绍 RNA pol II负责转录的基因,这些基因也称 II
类真核基因 。
一、真核生物的启动子
真核生物启动子的研究方法除采用保护法和足迹法
外,更多地是采用所谓的 反向遗传学( reverse
genetics)的方法进行研究。
真核生物的启动子大概包括以下几个位点:
1, TATA顺序 ( TATA box)
1979年 Goldberg首先注意到真核生物基因上游
-25~-30处有一段与 Probnow相似的保守顺序:
A23/56 T20/49 (41/%)T
37/90A39/95T37/90A35/85 A37/90T
18/44 A14/34
在这段顺序中, 头三个和倒数第二个核苷酸是
高保守的 。 TATA顺序除了可启动转录外, 它的位
置的准确性有保证转录起始从精确位置上开始的作
用 。
2, CAAT顺序 ( CAAT box)
CAAT顺序位于 -70~-80处, 比较保守的一致顺序
是:
GGC CAATCT
3, GC顺序 ( GC box), 也称远端因子 ( distal
element), 位于 -80~-100处, 其基本顺序是:
GGGCGG
C
T
说明:
?上述三段顺序并不是存在于所有真核生物的所有
基因, 其中 TATA box分布较广, 位于几乎所有
RNA polⅡ 转录的基因的前端 。
?三段顺序都不是绝对不变的, 不同的基因其顺序
可能相差较大 。
?人工定点突变说明, 这三段序列的任何一个单核
苷酸突变都将使基因的转录水平改变 ( 上升或下
降 ), 但并不使转录完全停止, 说明起作用的功能
单位并不是单个核苷酸 。
二, 增强子 ( enhancer)
,还与
一段称为增强子的顺序有关 。
1,核心顺序:增强子的长度相差较大, 可达几十
到几百个核苷酸, 其顺序变化也比较大, 但都含有
一段较相近的核心顺序 ( core sequence),
GTGG GAAATTT
2, 作用:其作用是使转录能力大大提高, 可达几
百至上千倍 。
3, 作用特点:增强子与启动子有几个明显不同的
特点:
?作用没有方向性, 不论位于基因上游, 下游或基
因内部, 不论是3 ’ → 5 ’ 或5 ’ → 3 ’ 方向排列,
都可发挥正常作用 。
?具有种属和组织的特异性, 但对外源启动子能正
常发挥作用 。
?作用范围较广, 有几个Kb范围内有效 。
?顺式作用 。
三, 起录点核, 糖体结合顺序与起译点
,起录点:原核生物的起录点常是CAT, 但
在真核生物中变化较大, 并不统一 。 但是刚开始转
录的第一个Nt也经常是A, 少数是G 。
的加帽位点, 所以这一位点又称为 Capping site 简
称Cap 。
2, 核糖体结合的顺序:真核生物的核糖体结合顺
序与原核生物的 SD顺序 ( AGGAGG) 明显不同 。
在真核生物中核糖体结合顺序是一段富含嘧啶的
TCCTTCC,这一顺序是mRNA与核糖体中18
SrRNA结合的位置 。
真核生物核糖体的结合过程还与 mRNA的帽结
构有关。在帽结合蛋白的介导下,核糖体 40S亚基
与 mRNA 5’端结合并沿 3‘端移动到 AUG的位点后,
60S亚基结合上去,开始蛋白质的翻译。
3, 起译点:真核生物的起译点与原核生物相同,
也是ATG, 极少数是GTG, 但不论ATG或G
TG, 结合的都是Met 。
四, 真核生物的终止子
真核生物终止子研究得不多, 还不很清楚, 但
已在组蛋白基因, SV40基因中发现类似于原核生
物的终止子 。
AACGGC CTTTTCAG GCCACCA
T T
T C
T A
C G
CT AG
C G
G C
AACG ACCAOH
C
T
G
A
五、总结
Enhancer TATA AATAAA Ter
CAAT Cap Ex,In,Ex.
AUG UGA
远上游区 近上游区 转录区
编码区 编码区
第三节 基因活性的调控
一, 操纵子 (operon)
操纵子大体上可以分为负控制诱导体系, 负控
制阻遏体系, 正控制诱导体系和正控制阻遏体系四
大类型 。
1.负控制诱导体系 ——乳糖操纵子
负控制:指酶的合成受阻遏物的影响, 在阻遏
物存在下酶不合成, 而当阻遏物不存在或失活时,
酶可合成 。
?乳糖操纵子调控的分子机制
lac I lac P lac O lac Z lac Y lac A
1100bp 90bp 35bp 3062bp 800bp 800bp
GTGAGTTAGCTCAC
( CRP位点,-87~-49)
-35 -10
TGTGTGGAATTGTGAGCGGATAACAATTTCACACA
-8 -5 +1 +21 +27
CRP
RNA pol 阻遏蛋白(四聚体)
-48 –35 -10
-49-87
-8 -5 +1 +5 +21 +27
TGTGTGGAATTGTGAGCGGATAACAATTTCACACA
基因 核苷酸对 氨基酸 /分子量
( KD)
功能单位 /分子量
( KD)
I 1100 360/38 四聚体 /152
Z 3062 1201/125 四聚体 /500
Y 800 275/30 单体
A 800 275/30 二聚体 /60
2.负控制阻遏体系:
,导
致阻遏物的激活并与操纵基因结合, 使基因关闭,
酶不能合成 。 这种类型的操纵子常见于与合成代谢
有关的操纵子 。
trp操纵子
3.正控制体系
指基因的转录受激活物的影响,在激活物的存
在下,基因才可转录。
如上述的乳糖操纵子的 CRP位点,40年代发现
了葡萄糖效应,研究发现 crp基因编码的产物 CRP
与 cAMP结合或形成 cAMP-CRP复合物,该复合物
与乳糖操纵子的 CRP结合位点结合或会促使乳糖操
纵子的转录。当细胞内存在葡萄糖时,葡萄糖的代
谢中间产物会抑制 cAMP环化酶的活性,导致细胞
内 cAMP水平下降,操纵子转录水平下降。
CRP作用机理:目前有两个学说
?变构学说:认为 cAMP-CRP与 CRP位点结合后导
致 DNA构型的局部改变,促使 RNA pol与启动子的
结合。
?双启动子学说:认为乳糖操纵子有两个启动子 P1
和 P2,P1与 RNA pol结合能力低但转录效率高; P2
与 RNA pol结合能力高但转录效力低。在无 cAMP-
CRP时 RNA pol优先与 P2结合但转录效率很低,有
cAMP-CRP时,cAMP-CRP与 CRP结合位点结合从
而覆盖了 P2,此时 RNA pol与 P1结合,转录效率高。












二、弱化子( attenuator,也称衰减子):
原核生物有些与氨基酸合成有关的操纵子,如
trp,his,ile等操纵子,含有两个终止子。一个位
于操纵子的末端,为正常的终止子,另一个位于操
纵子的上游前导区,有调控基因转录的功能,称为
弱化子。
弱化子在结构上是一个反向重复序列,可以形
成发夹式结构。如 trp操纵子的反向重复序列有四
个区域( 54~68,74~92,108~121,126~134)可
以互补配对,可形成 1,2和 3,4的配对或 2,3的配
对。
调控机理:由于原核生物的转录与翻译偶联,并且
在上游 +54~+59处有两个 Trp密码子( UGG),翻
译到此处时:
如果细胞内有较多的 Trp,核糖体可以很快地
通过此处而占据 1区和 2区,从而导致 3区和 4区配对,
形成终止子结构,转录被终止。
如果细胞内 Trp含量少,核糖体到达此处时将陷入
停顿,此时核糖体只占据 1区,导致 2区与 3区的配
对,4区处于游离状态,转录可以继续下去。
这是一种通过翻译过程来调控转录的现象。
三、调节子与真核生物的协同调控
?原核生物的调节子:指一个调节基因所发出的信
息同时控制几个操纵子的表达, 我们将这些操纵子
称为一个调节子 。
例如,大肠杆菌 与 Arg合成有关的基因共有 8个,
分处 5个操纵子, 这 5个操纵子都受 1个调节基因的
调控 。
R A G D B C E H F
?真核生物的协同调控
1969年,Britten & Davidson在原核生物协同的
启发下,提出了真核生物协同调控的模型,称
Britten-Davidson模型。






80年代以后才陆续有一些证据支持这一假设:
?酵母与 His合成有关的基因有四个,这四个基因 5’
端都有一段 TGACTC的共有序列( consensus
sequence)。野生型酵母在氨基酸饥饿的情况下,这
四个基因都能转录,但如果缺失共有序列的基因则
不能转录。
?果蝇的热诱导蛋白( heat shock protein HSP)是一
组热诱导下表达的蛋白质,这些蛋白质的 5’端上游
都有一段共有顺序 CTNGAATNTTCTAGA。缺失这
一顺序,在热诱导下基因不再表达。将这一序列接
在 tk基因(胸苷激酶基因)的 5’端,可使 tk基因变
为热诱导的。
?同源异型盒( hemeo box)
同源异型盒的发现或许可以认为是真核生物基因的
协同调控的证据之一 。 并获 1995年诺贝尔奖 。
在研究果蝇的胚胎发育时发现控制果蝇胚胎发
育过程中有许多主基因 ( master gene,指可以调节
控制许多其它相关基因的活性的基因 ) 。 这些主基
因都含有一段高度保守的, 长约 180bp的顺序, 这
一顺序称为同源异型盒 ( hemeo box) 。 具有同源
异型盒的基因称同源异型基因 。
同源异型盒 180bp的序列编码一段富含碱性氨
基酸的肽段, 一旦这些主基因发生突变将产生非常
严重的外观畸型, 所以估计, 这些主基因编码的蛋
白质都有一段富含碱性氨基酸的肽段, 而富含碱性
氨基酸肽段的蛋白质是一个DNA结合蛋白, 可以
调节许多其它基因的活性 。 按照这个假说, 可以认
为含有同源异型盒的基因 ( 称同源异型基因, 是主
基因的一种 ), 类似于操纵子中的调节基因 。
果蝇控制胚胎体节发育的基因至少有 8个,分处
两个基因复合体,分别称头角足复合体( 5个基因)
和双胸复合体( 3个基因)。这些基因的突变将带
来严重的后果。
同源异型盒基因除了在果蝇中发现外,在人、
老鼠、蛙类中均有发现,并具有和高的同源性。
老鼠 MO-10,蛙 MM3及三个果蝇同源异型盒的同源性比较
四, DNA甲基化作用
,胞嘧啶约有2-7 % 是甲
基化的, 这些甲基化的胞嘧啶往往出现在CG顺序
中 ( m5C) 。 由于这二个Nt是自身互补的, 并且
细胞内含有维持甲基化的酶, 所以在DNA的两条
链上总是同时出现甲基化现象 。
DNA甲基化作用是到目前为止在真核生物的调节
中唯一可以遗传的 。 经半保留复制后, 子链中的一
条链是甲基比的, 另一条新链随即可在甲基化酶的
作用下进行甲基比 。 所以推测甲基化作用可能在胚
胎发育中起调节作用, 它可以使某一细胞产生的子
代表达哪些基因, 从而决定某种发育命运 。
DNA甲基化可在细胞间遗传, 因此有人提出了, 后
生遗传, 的概念 。
DNA甲基化与基因活性调节的关系目前还不很清楚 。
已知在染色质发生变化而对 DNase I敏感的部位 ( 一般是
活性转录的位点 ) 往往伴随着去甲基化作用 。 体外实验证
据也表明, 甲基化的基因转录活性低, 而去甲基化的基因
转录活性高 。 至于甲基化作用是如何控制基因转录活性的,
目前还不清楚 。
五、免疫球蛋白的基因重排( rearrangment)
在除淋巴细胞以外的体细胞和生殖细胞中, 免
疫球蛋白基因在基因组上是由多个基因片段编码的 。
编码可变区的基因 ( V基因 ) 有许多个, 编码恒定
区的基因 ( C基因 ) 也有几个, 这两类基因是, 独
立, 的, 但都不能以独立的单独进行表达 。 它们必
须在淋巴细胞的发育过程中, 使V基因和C基因连
接在一起, 才能组成一个完全的有功能的基因, 才
可进行表达 。 在淋巴细胞中这种V- J的连接过程
就称为基因重排, 或者称为体细胞重组 ( somatic
recombination)
基因重排的分子机理:
免疫球蛋白基因的重排是通过反向重复序列形
成径环结构,而后由专一的酶系进行切割和连接。
免疫球蛋白类群的转换:
根据链恒定区的不同, 可以将免疫球蛋白分为
五类, 即 IgM,IgG,IgE,IgD和 IgA,其对应的重
链分别称为 μ,r, ε,δ和 α链 。
在免疫应答过程中, 免疫球蛋白的分泌常进行
类群的变换, 最早分泌的免疫球蛋白是 IgM,而后
是 IgG( 即 μ -r变换 ) 。 这种变换必然是以免疫球
蛋白C基因的变换为基础的, 我们将免疫球蛋白C
基因的这种变换作用称为类群的转换 ( class
switching,也称转辙 ) 作用
重链转换的机理与 V-J或 V-D-J拼接的机理不同,
他不是通过反向重复序列产生径 -环结构完成的,
而是通过转换区 S为中介进行的。 S区为一些较短
片段的重复,拼接时由两 C基因间的 S区进行重组,
去除中间的区域。
第四节 RNA的加工与调控
出来的RNA的大小不同, 原先转录出来的RNA
总是比较大, 称为前体, 从前体转变为成熟的RN
A的过程称为加工 ( processing) 。
对原核生物而言, 目前仅发现tRNA和rR
NA有加工过程 。
本节主要介绍真核生物的mRNA加工工程及
其与基因表达有关的调控过程。
RNA加工包括三个步骤:
一、5 ’ 端加帽
5 ’ 端的所谓帽结构是一个 7-甲基鸟嘌呤
( m7GpppNm) 。 m7G与下一个核苷酸 ( 即原初转
录物的第一个核苷酸, 常是A或 G) 的连接为5 ’
-5 ’ 连接, 这种结构称为相对核苷酸结构
( confronted nucleotide structure) 。
过程:
pppGpNp--- ppGpNp----
ppGpNp----+GTP GpppGpNp----
GpppGpNp---+SAM m7GpppGpNp--
核苷酸磷酸水解酶
mRNA鸟苷酸转移酶
mRNA嘌呤 7-甲基转移酶
m7GpppGpNp--+SAM m7GpppGmpNp--2’O-甲基转移酶
帽结构的功能:
?促进mRNA与核糖体结合。帽结构为核糖体与
mRNA的结合提供信号,能够促使核糖体与 RNA的
结合,但不是决定性的。
?增加mRNA的稳定性。 避免 5’核酸外切酶的水
解。
二, 3’端加尾
?RNA裂解信号:在大多数真核生物的基因的3 ’
端有一段AATAAA顺序, 多聚腺苷酸化就发生
在这段顺序下游的 14~20bp处, 这一顺序就称为R
NA裂解信号 。 其作用就是指导核酸内切酶在下游
14~20bp处将RNA裂解, 并在 polyA多聚酶作用
下加上 50~200个腺苷酸组成的polyA 。
?功能:polyA的功能还不很清楚, 估计与下
列几个方面有关,( 1 ) 与mRNA运入细胞质有
关; ( 2 ) 延长mRNA的寿命; ( 3 ) 可控制翻
译效率
三, hnRNA的剪接 ( splicing)
mRNA上, 在mRNA成熟过程中必须切除内含
子, 使几个外显子拼接起来, 这一过程称为mRN
A的剪接 ( 或称拼接 ) 。
?剪接的识别信号
,否则将会打乱
mRNA上的阅读框从而带来相当严重的后果 。 要保
证切除的准确性, 可能与许多因素有关, 就目前所
知其最关键的因素是内含子 ——外显子的边界顺序,
即内含子与外显子的接头 ( exon-intron junction) 。
接头顺序,考察了包括人, 小鼠, 兔, 爪蟾, 酵母
等不同生物来源的基因的 90个供体 ( 指内含子 5’
断区域 ) 和 85个受体 ( 内含子 3’端区域 ), 发现
这两个区域都没有广泛的同源性, 但有一个非常保
守, 很短的接头顺序, 即在内含子的5 ’ 端为GT,
3 ’ 端为AG, 这四个碱基是高度保守的, 称为
GT-AG法则 或 Chambon法则 ( Chambon rule) 。
A 32 38 59 9
G 20 11 12 68
C 25 37 13 4
T 23 4 12 9
0 0 50 61 9 14
90 0 30 12 77 9
0 0 4 8 1 11
0 90 6 9 3 56
A 4 6 20 3 85 0
G 7 5 19 1 0 85
C 31 27 25 63 0 0
T 43 47 21 18 0 0
19 11 24
40 27 19
17 15 26
9 32 19




GT-AG虽然很短, 但对于剪接则是必须的, 一
旦发生突变往往会带来相当严重的后果 。 不论是G
T或AG突变, 其结果是在GT或AG附近有相同
顺序的位点进行剪接 ( 即所谓的潜在位点的活化 ),
合成无效的蛋白质 。
接头顺序以外的因素,虽然发现了GT-AG法则,
但是在基因内肯定会有不少并不起剪接作用的GT
或AG ( 即所谓的潜在位点 ) 的存在, 如何保证在
正确的GT-AG位点上进行剪接肯定还有其它因
素的影响, 只是目前还了解得不多 。 只在内含子 3’
端上游 20~50bp处有一保守序列:
PyNPyTPuAPy ( Py嘧啶, Pu嘌呤 )
?剪接机理
虽然发现了GT-AG法则及边界以外与剪接
有关的顺序, 但还不能说明剪接的机理 。 目前有一
些证据说明核内一些小分子RNA (共有六种 ) 可
能与内含子的剪接有关, 这些核内小分子RNA
( small nuclear RNA,snRNA ) 由 100~400个 bp
组成, 相当于 6~8s,每个细胞内含 104~106个分子,
因为这些小分子RNA富含尿嘧啶 ( u ) 故而以
U1,U2……等表示 。 其中以 U1最为重要 。 snRNA的
碱基排列非常保守, 例如人和小鼠的 U1只有2个
bp的差异 。
现在知道它是通过 U1 RNA形成一个套索结构,
然后在多个蛋白质 ( 酶 ) 的参与下完成剪接 。
四、其他类型内含子的剪接
内含子至少可以分为三种类型:
自我剪接,RNA剪接还有另外一种特殊的现象,
就是所谓的自身剪接 ( self-splicing) 。 1982年 Cech
等人发现四膜虫 rRNA的一个 413bp的内含子可以在
没有任何蛋白质存在下被正确切除, 所以不得不承
认rRNA有自身催化剪接的活性, 也将这种有催
化活性的RNA称为核糖核酸拟酶 ( ribozyme) 。
根据内含子的结构差异及剪接机理的不同, 自
身剪接的内含子分为 I型和 II型两种 。
I











II











1982年 Cech等人报道了 RNA自身剪接反应之后,
许多学者对RNA催化活性进行了许多研究, 并取
得了惊人的进展, 1983年, Altman和 Pace两个小组
证明了细菌核糖核酸酶 RNaseP中的RNA部分具
有催化活性 。 1986年 Cech进一步证明四膜虫 rRNA
不仅可催化自我剪接, 而且具有核苷酸转移酶, 磷
酸二酯酶 ( 核糖核酸酶 ), RNA限制性内切酶,
磷酸转移酶和磷酸酯酶等多种活性 。 1987 年
Uhlenbeck实验室人工合成了具有催化活性的19
Nt组成的寡核糖核苷酸 。 1989年, Szostak和
Cech报道RNA催化剂能催化RNA自我复制,
这些证据足以证明RNA是一种真正的生物催化剂,
正日益受到人们的瞩目 。
五、差别加工和基因调控:
大鼠甲状腺中合成的降钙素和脑下垂体合成的神经肽
是来自于同一个初级转录物, 在这个初级转录物中有两个
polyA加尾信号, 在甲状腺是用第一个 polyA加尾信号合
成降钙酸, 而在脑下垂体中利用第二个 polyA加尾信号合
成神经肽, 所以它们有共同的N末端顺序 。
腺病毒的晚期蛋白是一个复合转录单位, 含有5个
polyA位点和许多外显子, 它的初级转录物可以被剪接成
12种不同的 mRNA。 每种 mRNA由四个外显子组成, 前三
个外显子在所有的 mRNA中都是一样的, 而后一个外显子
则各不相同 。
这种可以加工成不同的mRNA的初级转录物称为 复
合转录单位 。
小鼠可以在肝脏和唾腺中合成淀粉酶,两者是有同一个基
因编码,但具有不同的前导序列。
exon L intron exon S intron exon 2 intron exon 3
50bp 2800bp 161bp 4500bp 205bp 327bp
L 2 3 S 2 3
肝脏 唾腺
五,RNA编辑( RNA edition)
1986年 Benne等在布氏锥虫及簇生短膜虫中发现,
它们的线粒体的 cox II(细胞色素 C氧化酶亚基 II)
基因的 mRNA含有 4个非基因组编码的 U残基,正
是因为它们的插入而抑制了原来基因的移码突变,
形成完整的开放阅读框,产生了有活性的 cox II。
以后在一些植物的线粒体 mRNA、哺乳动物某
些核基因 mRNA、某些病毒的 mRNA也陆续发现。
甚至有些基因还进行了相当大范围的改动,达序列
的 50%,甚至 60%(如线粒体的 cox III)。由于原
基因与 mRNA在序列上有非常大的差异,因此有人
将原基因称为 模糊基因(隐秘基因, cryptogene)
模糊基因的类型,
?I型:内部编辑的模糊基因
?II型,5’端编辑的模糊基因
?III型:泛编辑的模糊基因
RNA编辑的类型,
包括核苷酸的插入、取代及删除等。
RNA编辑的可能机理,
RNA编辑与细胞内的一类小分子 RNA
( 50~70bp)有关,它们的作用是为插入或删除 U
提供模板,因此称为指导 RNA( guide RNA,
gRNA)。
gRNA的 5’端可以与被编辑的 RNA互补配对,从
而确定被编辑的区域,称为锚区。不能与锚区配对
的 mRNA的第一个核苷酸成为被编辑的对象。
gRNA的 3’端有 5~25个寡聚 U,是提供(添加) U或
接受(删除) U的区域,即活性区域。
RNA编辑的生物学意义,
?RNA编辑的普遍性:从病毒到哺乳动物,从线粒体基因
到核基因都存在。
?RNA编辑的多样性:从内部编辑到泛编辑;从起始密码、
终止密码到移码序列的消除或建立,使一个意义模糊的基
因(模糊基因)变成一个有意义的 mRNA。
?RNA编辑的特异性:编辑具有种的特意性及组织的特异
性,是一种遗传的特征,是遗传信息加工的一种重要形式。
?RNA编辑的存在问题,RNA编辑的遗传信息是如何编码
的?是一种古老的遗传信息的加工方式?是对中心法则的
一个挑战?
第五节 翻译水平上的调控
一, 稀有密码子与翻译调控
稀有密码子,指在一般情况下利用率很低的密
码子 。
E.coli的 dnaG( 编码冈崎片段前RNA引物的聚
合酶 ), rpoD( 编码 RNA polymerase的 ζ亚基 )
和 rpsU( 编码核糖体上的一种小分子蛋白质 S21 )
同属一个操纵子 (rpsU-dnaG-rpoD),但三个基因的
产物却不太相同, dnaG产物有 50个拷贝, rpoD产
物 2800拷贝, rpsU产物 40000拷贝 。
考察 dnaG的密码子并与 rpoD和另外 25种非调
控蛋白的密码子进行比较, 发现在密码子的利用上
dnaG与它们有明显的不同, dnaG基因使用了许多
的稀有密码子, 例如 Ile的密码子 AUA在 dnaG基因
的利用率特别高 。
密码子使用情况比较 ( %),
Ile密码子 AUU AUC AUA
25种非调控蛋白 37 62 1
dnaG 36 32 32
rpoD 26 74 0
除了 Ile以外,还有,UCG(Ser),CCU(Pro)、
CCC(Pro),ACG(Thr),CAA(Gln),AAU(Asn)、
AGG(Arg)等密码子。
其他一些调节蛋白,如,lacI,araC,trpR等基
因的产物在细胞内的含量也很少,这些基因密码子
的使用频率与 dnaG基因相似而明显不同于非调控
蛋白。
稀有密码子对翻译的调控机制是由于细胞内相
应的带有反密码子的 tRNA含量较少,影响了蛋白
质的翻译。
在真核生物中同样发现利用稀有密码子进行调
控的现象。
二, 重叠基因与翻译调控
等克分子的关系结合成为一个四聚体的 。 那么细胞
内是如何控制这种等克分子产物的合成呢? 通过分
析D基因和E基因的交接处发现:
E Thr Phe stop
ACUUCCUGAUGGCU
Met Ala D
其中A是两个基因的重叠部位 。 当E基因翻译
到终止密码子时, 马上启动D基因的翻译, 这种现
象在许多噬菌体基因组中经常发现 。 这种利用重叠
基因的方式使两基因的产物保持一致的现象称 翻译
偶联现象 。
三、反义 RNA与翻译调控
反义 RNA( anti-sense RNA)早期也称为 mic RNA
( mRNA-interfering complementary RNA,干扰
mRNA的互补 RNA。
例 1,E.coli的外膜孔蛋白 ( outer membrance protein)
这是一类与渗透压调节的蛋白质, 在 E.coli中与
ompF,ompC及 ompB三个基因有关, 其中C和F
是结构基因, B是调节基因 。
当外界渗透压升高时, C基因产物量增加而F
基因的产物量下降, 两者维持恒定的总量 。
研究发现,C基因可以双向转录,除转录出C
基因的 mRNA外,还可反向转录一段 174bp的 RNA,
这一 RNA与F基因有较强的同源性,可与F基因
的 mRNA发生互补,从而阻止F基因 mRNA的翻译。
这一 174bp的 RNA就称反义RNA。
micF omp C omp F
例 2:转座子 Tn10的转座酶基因有两个启动子,一
个位于结构基因的上游,启动转座酶基因的转录。
另一个位于结构基因内部启动反方向转录反义
RNA。反义RNA可与转座酶基因 RNA互补而中
止转座酶基因的翻译。从而调控细胞内 Tn10的拷
贝数。
启动子 1——转座酶基因
启动子 2——反义 RNA
利用反义 RNA原理,进行肿瘤或爱滋病基因
治疗是目前临床应用的主要手段之一,也是基因治
疗研究的主要方向。