第十二章 蛋白质的生物合成及转运
蛋白质的生物合成在细胞代谢中占有十分重要的地位。目前已经完全清楚,贮存遗传信息的DNA并不是蛋白质合成的直接模板,DNA上的遗传信息需要通过转录传递给mRNA。mRNA才是蛋白质合成的直接模板。mRNA是由4种核苷酸构成的多核苷酸,而蛋白质是由20种左右的氨基酸构成的多肽,它们之间遗传信息的传递与从一种语言翻译成另一种语言时的情形相似。所以人们称以mRNA为模板合成蛋白质的过程为翻译或转译(translation)。
翻译的过程十分复杂,几乎涉及到细胞内所有种类的RNA和几十种蛋白质因子。蛋白质合成的场所是核糖体,合成的原料是氨基酸,反应所需能量由ATP和GTP提供。蛋白质合成的早期研究工作都是用大肠杆菌的无细胞体系进行的,所以对大肠杆菌的蛋白质合成机理了解最多。真核细胞蛋白质合成的机理与大肠杆菌的有许多相似之处。
第一节 遗传密码任何一种天然多肽都有其特定的严格的氨基酸序列。有机界拥有1010~1011种不同的蛋白质,构成数目这么庞大的不同的多肽的单体却只有20种氨基酸。氨基酸在多肽中的不同排列次序是蛋白质多样性的基础。目前已经清楚,多肽上氨基酸的排列次序最终是由DNA上核苷酸的排列次序决定的,而直接决定多肽上氨基酸次序的却是mRNA。不论是DNA还是mRNA,基本上都由4种核苷酸构成。这4种核苷酸如何编制成遗传密码,遗传密码又如何被翻译成20种氨基酸组成的多肽,这就是蛋白质生物合成中的遗传密码的翻译问题。
一、密码单位
用数学方法推算,如果mRNA分子中的一种碱基编码一种氨基酸,那么4种碱基只能决定4种氨基酸,而蛋白质分子中的氨基酸有20种,所以显然是不行的。如果由mRNA分子中每2个相邻的碱基编码一种氨基酸,也只能编码42=16种氨基酸,仍然不够。如果采用每3个相邻的碱基为一个氨基酸编码,则43=64,可以满足20种氨基酸编码的需要。所以这种编码方式的可能性最大。应用生物化学和遗传学的研究技术,已经充分证明了是mRNA上三个相邻的碱基编码一个氨基酸。所以叫三联体密码或密码子(codon)。
首先介绍一下生物化学方面的证明。1961年Nirenberg等用大肠杆菌无细胞体系,外加20种标记氨基酸混合物及Poly U,经保温反应后,发现只有苯丙氨酸的多聚体。显然Poly U起了信使RNA的作用。所以UUU是编码苯丙氨酸的密码子。
进一步,Nirenberg和Ochoa等用Poly UG和Poly AC重复上述类似实验,发现标记氨基酸掺入新合成的肽链的频率与按统计学方法推算出的多核苷酸中三联体密码出现的频率相符合(表12-1)。应用这种方法,很快确定了为20种氨基酸编码的全部密码子。
表12-1 无序Po1y UG对氨基酸的编码(U:G=5:1)
可能的密码子
按计算可能出现的频率*
氨基酸掺入的相对量
UUU
100
Phe (100)
UUG
UGU
GUU
20
Cys (20)
Val (20)
UGG
GUG
GGU
4
G1y (4)
Trp (5)
GGG
0.8
—
* 以UUU的出现频率为100计。
进一步要解决的问题是密码子中三个碱基的排列次序问题。1964年Nirenberg等应用大肠杆菌核糖体与人工合成的多聚核苷酸、Mg2+及一种与人工模板上密码子相对应的氨酰-tRNA(只缺GTP)一起保温。由于反应体系中无GTP,掺入的氨基酸不可能形成多肽。应用这种方法,发现具有密码子功能的最短链为三核苷酸,最有效的是3′-OH和5′-磷酸基的三核苷酸。3′-磷酸基为末端的三核苷酸无模板功能。所以密码子的读法是有方向的。如pGpUpU对缬氨酸专一,而UpUpGp却对亮氨酸专一。
当应用合成的三核苷酸重复序列作模板时,得到很有意义的结果。如以Po1y UUC作模板时,得到的产物是三种不同的多肽:多聚苯丙氨酸、多聚丝氨酸和多聚亮氨酸。这是因为从不同的碱基开始阅读密码所引起的:
UUC-UUC-UUC-UUC-UUC——编码苯丙氨酸
UCU-UCU-UCU-UCU-UCU——编码丝氨酸
CUU-CUU-CUU-CUU-CUU——编码亮氨酸
表12-2列出了应用带有重复序列的人工合成的多核苷酸模板与掺入的氨基酸之间的关系。
应用上述方法,仅用了4年时间,于1965年完全确定了编码20种天然氨基酸的60多组密码子,编出了遗传密码字典(表12-3)。
表12-2 带重复系列的人工多核苷酸模板与掺入的氨基酸之间的关系重复序列
多核苷酸中的密码子
掺入的氨基酸
UC
AG
UG
AC
UUC
AAG
GAU
UAC
GUA
UAUC
UUAC
UCU,CUC
AGA,GAG
UGU,GUG
ACA,CAC
UUC,UCU,CUU
AAG,AGA,GAA
GAU,AUG,UGA
UAC,ACU,CUA
GUA,UAG,AGU
UAU,CUA,UCU,AUC
UUA,CUU,ACU,UAC
Ser,Leu
Arg,Glu
Cys,Val
Thr,His
Phe,Ser,Leu
Lys,Arg,Glu
Asp,Met
Tyr,Thr,Leu
Val,Ser
Tyr,Leu,Ser,Ile
Leu,Thr,Tyr
5′-磷酸末端
中 间 的 碱 基
3′-OH基末端的碱基
的碱基
U
C
A
G
U
U
苯丙氨酸
苯丙氨酸
亮氨酸
亮氨酸
丝氨酸
丝氨酸
丝氨酸
丝氨酸
酪氨酸
酪氨酸
终止信号
终止信号
半胱氨酸半胱氨酸
终止信号
色氨酸
C
A
G
U
C
亮氨酸
亮氨酸,
亮氨酸
亮氨酸
脯氨酸
脯氨酸
脯氨酸
脯氨酸
组氨酸
组氨酸
谷酰胺
谷酰胺
精氨酸
精氨酸
精氨酸精氨酸
C
A
G
U
A
异亮氨酸
异亮氨酸
异亮氨酸
甲硫氨酸和甲酰甲硫氨酸
苏氨酸
苏氨酸
苏氨酸
苏氨酸
天冬酰胺
天冬酰胺
赖氨酸
赖氨酸
丝氨酸
丝氨酸
精氨酸
精氨酸
C
A
G
U
G
缬氨酸
缬氨酸缬氨酸缬氨酸
丙氨酸
丙氨酸
丙氨酸
丙氨酸
天冬氨酸
天冬氨酸谷氨酸谷氨酸
甘氨酸
甘氨酸甘氨酸甘氨酸
C
A
G
表12-3 遗传密码字典*
*密码子的阅读方向5′→3′,AUG为起始密码子。
用遗传学方法也证明了遗传信息是三联体密码。用某些吖啶染料可以引起T4噬菌体DNA插入或删去1、2或3个碱基。实验的原理可用假设的噬菌体DNA加以说明。
删去碱基的数目:
0 CAT CAT CAT CAT CAT CAT CAT
1 CAT CTC ATC ATC ATC ATC ATC
↓
A
2 CAT CTC ACA TCA TCA TCA TCA
↓ ↓
A T
3 CAT CTC ACA TAT CAT CAT CAT
↓ ↓ ↓
A T C
当删去一个碱基A时,从这一点以后的密码就发生了差错。删去两个碱基时,情形也如此。但是删去三个碱基时,情况就不同了。最先也形成几组错误的密码子,但以后又恢复正常。前面两类突变往往使基因产物全部失去活力,而第三种突变类型使基因产物仍具有一定活力。这只能用遗传密码是三联体这个事实来加以解释。
二、遗传密码的基本特性
1.密码无标点符号
即两个密码子之间没有任何起标点符号作用的密码子加以隔开,因此,要正确阅读密码必须按一定的读码框架从一个正确的起点开始,一个不漏地挨着读下去,直至碰到终止信号。若在遗传密码中插入或删去一个碱基,就会使这以后的读码发生错误,这称为移码。由移码引起的突变称为移码突变。
2.一般情形下遗传密码不重叠
假设mRNA上的核苷酸序列为ABCDEFGHIJKL……,按不重叠规则读码时应读为ABC DEF GHI JKL等,每三个碱基编码一个氨基酸,碱基的使用不发生重复:
ABC DEF GHI JKL
…aa1….,aa2……aa3…..aa4…,
如果按完全重叠规则读码,则应该是ABC编码aa1,BCD编码aa2,CDE编码aa3,……。目前已经证明,在绝大多数生物中,读码规则是不重叠的。
3.密码的简并性(Clegeneracy)
大多数氨基酸都可以具有几组不同的密码子,如UUA、UUG,CUU、CUC、CUA及CUG6组密码子都编码亮氨酸。这一现象称为密码的简并。可以编码相同氨基酸的密码子称为同义密码子(synonymcodon)。只有色氨酸及甲硫氨酸只有一个密码子(表12-4)。密码的简并性在生物物种的稳定性上具有一定意义。
4.密码子中第三位碱基具有较小的专一性 ( 遗传密码的“摆动性”)
密码的简并性往往只涉及第三位碱基。如丙氨酸有4组密码子:GCU、GCC、GCA、GCG,前两位碱基都相同,均为GC,只是第三位不相同。已经证明,密码子的专一性主要由前两位碱基决定,第三位碱基的重要性不大。Crick对第三位碱基的这一特性给予一个专门的术语,称为“摆动性”。当第三位碱基发生突变时,仍能翻译出正确的氨基酸来,从而使合成的多肽仍具有生物学活力。特别应该指出的是:tRNA的反密码子中,除A、U、G、C4种碱基外,还经常出现次黄嘌呤I。次黄嘌呤的特点是,与U、A、C三者之间都可以配对,这就使得凡带有I 碱基的反密码子都具有阅读mRNA上密码子的非凡能力,从而减少了由于遗传密码突变而引起的误差。
表12-4 氨基酸密码子的简并
氨 基 酸
密码子数目
氨 基 酸
密码子数目
丙氨酸
精氨酸
天冬酰胺
天冬氨酸
半胱氨酸
谷酰胺
谷氨酸
甘氨酸
组氨酸
异亮氨酸
4
6
2
2
2
2
2
4
2
3
亮氨酸
赖氨酸
甲硫氨酸
苯丙氨酸
脯氨酸
丝氨酸
苏氨酸
色氨酸
酪氨酸
缬氨酸
6
2
1
2
4
6
4
1
2
4
这一点已经得到实验证明。酵母tRNAAla的反密码子为IGC,可阅读GCU、GCC、GCA几组密码子,
反密码子:3′-C-G-I-5′ 3′-C-G-I-5′ 3′-C-G-I-5′
,::,::,::
密码子,5′-G-C-U-3′ 5′-G-C-C-3′ 5′-G-C-A-3′
tRNA反密码子上的G、U可分别与密码子上的U、C和G、A配对(表12-5)。
5.64组密码子中,有三组不编码任何氨基酸,而是多肽合成的终止密码子(termination codon)
反密码子
密码子
A
U
C
G
G
U
C
I
U
C
A
U
G
A
终止密码子为UAG、UAA、UGA。另外一组密码子AUG既是甲硫氨酸的密码子,又是肽链合成的起始密码子(initiation codon)。
6.密码近于完全通用
所谓密码的通用性是指各种高等和低等的生物(包括病毒、细菌及真核生物等)在多大程度上可共用同一套密码。较早时,曾认为密码是完全通用的。让兔网织红血球的核糖体与大肠杆菌的氨酰-tRNA及其他蛋白质合成因子一起进行反应时,合成的是血红蛋白,说明大肠杆菌tRNA上的反密码子可以正确阅读血红蛋白mRNA上的信息。这样的交叉试验也在豚鼠和南非爪蛙等其他生物中进行过,都证明了密码的通用性。
但是最近的一些发现对密码的通用性提出了质疑。线粒体DNA中的编码情形显然违背了遗传密码的通用性。如人线粒体中UGA不再是终止密码子,而编码色氨酸。表12-6列出了人线粒体基因组编码的特点。
酵母线粒体、原生动物纤毛虫也有类似情形。所以结论应该是:遗传密码并非是绝对通用的,而是近于完全通用的。
密码子
通常情况下可编码的
线粒体DNA所编码的
UGA
UGG
AUA
AUG
AGA
AGG
终止信号色氨酸异亮氨酸甲硫氨酸精氨酸精氨酸
色氨酸色氨酸甲硫氨酸甲硫氨酸终止信号终止信号
蛋白质合成的分子基础
氨基酸是在核糖体上加入到多肽链中的。在与mRNA作用之前,氨基酸先共价地与转运RNA(transfer RNA,tRNA)形成氨酰-tRNA。氨酰-tRNA结合到mRNA的特殊位点上。mRNA含有遗传密码的信息,用于指导特定氨基酸序列多肽链的合成。一个核糖体结合到一个mRNA分子合成起始序列上,并由此开始读码,沿着密码序列合成一条多肽链。读码的方向是从mRNA的5′到3′,而合成出来的多肽则是从氨基端到羧基端。通常,一个mRNA分子上可结合有多个不同时间开始翻译的核糖体,这样的结构称为多聚核糖体(polysome)。在原核细胞中,mRNA的转录与多肽的翻译是同时进行的,如图12-1所示,可见在染色体DNA分子上,有多条正在转录的mRNA分子,每个分子上都结合有多个正在进行翻译的核糖体。真核生物的转录与翻译是在不同的地方进行的,核糖体可以自由地存在于细胞质中,或者与内质网膜结合。RNA分子在蛋白质的合成中起着举足轻重的作用,除了mRNA和tRNA,核糖体还含有核糖体RNA(ribosome RNA,rRNA)。
一、mRNA是蛋白质合成的模板
Jacob F.和Monod J.早在1961年就已提出mRNA的概念。他们认为,既然蛋白质是在细胞质中合成的,而编码蛋白质的信息载体DNA却在细胞核内,所以必定有一种中间物质用来传递DNA上的信息。他们研究大肠杆菌中与乳糖代谢有关酶类的生物合成时发现诱导物,如异丙基硫代半乳糖苷(β-isopropylthiogalactoside)的加入,可以立刻使酶蛋白的合成速度增加上千倍。而诱导物一旦消失,又可使酶蛋白的合成立刻停止。这个实验结果给人的启示是:蛋白质合成的模板是一种不稳定的物质,其半寿期很短。他们对这种信使物质的性质作了如下的预言:
①信使是一种多核苷酸。
②信使的碱基组成应与相应的DNA的碱基组成相一致。
③信使的长度应是不同的,因为由它们所编码的多肽链的长度是不同的。
④在多肽合成时信使应与核糖体作短暂的结合。
图12-1 大肠杆菌中mRNA的转录与多肽的翻译是同时进行的
A为多聚核糖体的电镜照片
⑤信使的半寿期很短,所以信使的合成速度应该是很快的。
所以,这样的信使可能是一种RNA。但是当时已发现的两种RNA都不具备这些特性。各种生物的rRNA的大小差异不大,碱基组成的变化也不大。tRNA除了有与rRNA相同的问题以外,它们的分子也太小,所以这两种RNA都不能胜任信使的功能。可喜的是当时已有人提出过,认为细胞中有可能存在第三种RNA。被噬菌体T2感染后的大肠杆菌中,有人发现有一种新的RNA,它的代谢速度极快,分子的大小也参差不齐,碱基组成又与T2DNA相一致。这些特性都符合信使分子的要求。
mRNA的概念提出后,还必须要用实验来证明这种概念是否正确。Brenner S.,Jacob F.和Monod M.等人设计了一组实验:用噬菌体T2感染大肠杆菌后,发现几乎所有在细胞内合成的蛋白质都不再是细胞本身的蛋白质,而是噬菌体所编码的蛋白质,这些蛋白质的合成速度与细胞总RNA的合成速度无关;T2感染后不久,细胞中出现了少量半寿期很短的RNA,它们的碱基组成与T2DNA是一致的。上述这些特性都与他们预言的信使分子特性十分符合。他们将大肠杆菌接种在含有重标记(15N和12C)的培养基上,再用T2感染。感染后立刻将细菌转移到含有轻同位素(14N和12C)的培养基上。再将T2感染前与感染后的细菌破碎,分离出核糖体,用密度梯度超离心技术将带有重同位素的核糖体与带有轻同位素的核糖体分开。他们还用32P或用14C尿苷去标记RNA,并用35S-甲硫氨酸去标记新合成的蛋白质。这些实验结果(图12-2)表明:
①T2感染后并无轻标记核糖体出现,说明在T2感染后并未引起新核糖体的合成。
②T2感染后,诱发了新的RNA的合成。大多数放射性标记的RNA出现在重标记核糖体中。这种新合成的RNA代谢速度极快。
③35S标记的蛋白质只暂时出现在重标记核糖体中,说明新合成的蛋白质是在早就存在的核糖体中合成的。
以后,Spiegelman又用分子杂交技术证明了经T2感染后的新合成的RNA可以与T2DNA杂交,但细胞内的其他RNA则不能与T2DNA杂交,从而证明新合成的RNA是由T2噬菌体DNA编码的。
对于mRNA的结构特征,我们已经有了较详尽的了解。mRNA以核苷酸序列的方式携带遗传信息,通过这些信息来指导合成多肽链中的氨基酸的序列。每一个氨基酸可通过mRNA上3个核苷酸序列组成的遗传密码来决定,这些密码以连续的方式连接,组成读码框架(reading frame)。读码框架之外的序列称作非编码区,这些区域通常与遗传信息的表达调控有关。在读码框架的5′端,是由起始密码(start codon)AUG开始的,它编码一个蛋氨酸。在读码框架的3′端,含有一个或一个以上的终止密码(stop codon):UAA、UAG和UGA,其功能是终止这一多肽链的合成。在真核生物mRNA的3′端,通常还含有转录后加上去的多聚腺嘌呤核苷酸(polyA)序列作尾巴,其功能可能与增加mRNA分子的稳定性有关。
mRNA分子的5′端序列对于起始密码的选择有重要作用,这种作用对于原核生物和真核生物还有所差别。原核生物中(图12-3),在mRNA分子起始密码子的上游含有一段特殊的核糖体结合位点(ribosome-binding site)序列,这一结合位点使得核糖体能够识别正确的起始密码AUG。原核生物的mRNA通常是多基因的,分子内的核糖体结合位点使得多个基因可独立地进行读码框架的翻译,得到不同的蛋白质。而对于真核生物而言,其mRNA通常只为一条多肽链编码,核糖体与mRNA 5′端的核糖体进入部位(ribosome entry site)结合之后,通过一种扫描机制向3′端移动来寻找起始密码,mRNA 5′末端的帽子结构可能对于核糖体进入部位的识别起着一定作用。翻译的起始通常开始于从核糖体进入部位向下游扫描到的第一个AUG序列。
图12-3 真核生物及原核生物mRNA结构简图
二、tRNA转运活化的氨基酸至mRNA模板上
tRNA含有两个关键的部位:一个是氨基酸结合部位,另一个是与mRNA的结合部位。对于组成蛋白质的20种氨基酸来说,每一种至少有一种tRNA来负责转运。为了准确地翻译,每一种tRNA必需能被很好地识别。在书写时,将所运氨基酸写在tRNA的右上角,如tRNAPhe及tRNASer分别表示苯丙氨酸和丝氨酸转运的tRNA。大多数氨基酸具有几种用来转运的tRNA,一个细胞中,通常含有50或更多的不同的tRNA分子。
tRNAPhe是第一个通过X射线晶体衍射技术测定了tRNA分子的空间结构,其他tRNA都与它类似,可用一个如图12-4的结构来表征其一级、二级、三级结构。所有的tRNA都是有由50-95?(70-90)个核苷酸组成的一条多聚核苷酸链,这条链经过折叠,呈现三叶草型结构,含有4个双链的茎和4个单链的环。5′端和3′端的碱基通过形成7个Waston-Crick碱基配对将两端拉到一起,形成受体端,氨基酸通过与3′端的核糖连接而形成氨酰-tRNA分子。tRNA的3′端通常是CCA的序列。
未配对的环的命名由其特定的结构来定。环I的大小在7~11个核苷酸之间,常含有稀有碱基dihydrouracil,故命名为D环;环Ⅱ含有被称作反密码子(anticodon)的3个碱基序列,被命名为反密码子环。tRNA的这一部分在蛋白质的合成中非常重要,它可与mRNA模板上的密码子进行碱基配对的专一性的识别,并将所携带的氨基酸送入到合成的多肽链的指定位置上;环Ⅲ是可变环,其组成可在3~21个碱基之间,是tRNA大小变化最大的区域;环Ⅳ含有稀有的胸腺嘧啶核糖核苷(ribothymidine)和假尿嘧啶核苷(pseudouridine)(符号ψ表示)碱基作为不变序列,故把它叫做TψC环。
tRNA三叶草型的二级结构可折叠成L-型的三维结构,如图12-4所示,这一结构由两个螺旋以直角的方位构成,结合氨基酸的一端称接受臂(acceptor arm),另一端则含有反密码子,被称作反密码子臂(anticodon arm)。tRNA分子上与多肽合成有关的位点至少有4个,分别为3′端CCA上的氨基酸接受位点、识别氨酰-tRNA合成酶的位点、核糖体识别位点及反密码子位点。
图12-4 tRNA的结构简图
tRNA在识别mRNA分子上的密码子时,具有接头(adaptor)的作用。氨基酸一旦与tRNA形成氨酰-tRNA后,进一步的去向就由tRNA来决定了。tRNA凭借自身的反密码子与mRNA分子上的密码子相识别(图12-5),而把所带的氨基酸送到肽链的一定位置上。Chapeville及Lipmann(1962)做了一个巧妙的实验来证明这一点。将放射性同位素标记的半胱氨酸在半胱氨酰-tRNA合成酶催化下与tRNACys形成半胱氨酰-tRNACys,然后用活性镍作催化剂,使半胱氨酸转变成丙氨酸,形成丙氨酰-tRNACys。然后将它放到网织红细胞无细胞体系中进行蛋白质合成。分析后,发现丙氨酸插入了本应由半胱氨酸所占的位置。
前面在讨论遗传密码的性质时曾提到过密码的简并性问题。这里将进一步讨论与此有关的tRNA分子突变与校正基因(suppressor gene)的问题。遗传学家早就发现了回复突变(reverse mutation)现象。回复突变的原因很多,其中有一种回复突变是由于其在基因上发生的一个突变引起的,这称为基因间校正突变。长期以来人们很难解释基因间校正突变。但是现在由于对tRNA的结构功能有了较深入的了解,基因间校正突变的本质已经被揭露了。大多数校正突变是发生在tRNA基因的突变上,从而使tRNA的反密码子在阅读mRNA的信息时发生了变化。下面举一个例子加以说明(图12-6)
从图12-6可以看出,某基因中部发生点突变而出现了一个额外的终止密码子UAG,于是多肽的合成在中途终止,产物失去生物活性,所以这种突变称为无义突变(nonsense mutation),因为基因产物变得没有什么生物学意义了。对酪氨酸专一的tRNA上的反密码子应为3′—AUG—5′,但如果此tRNA的基因发生突变,使反密码子变成3′—AUC—5′,它就可以将mRNA上的终止信号UAG读成酪氨酸了,从而使多肽的合成得以继续。所合成的多肽中只有在酪氨酸处发生突变,这样的多肽突变体常具有部分或全部活力。通常,当有某种tRNA突变分子出现时,也必定有可以识别正常氨基酸的tRNA存在。例如,tRNATyr的突变分子可识别终止信号,但同时也必定有可以正常识别UAC,UAU酪氨酸密码子的tRNATyr分子存在。这样,就可使翻译维持正常。
三、核糖体是蛋白质合成的工厂
早在1950年就有人将放射性同位素标记的氨基酸注射到小鼠体内,经短时间后,取出肝脏,制成匀浆,离心,分成核、线粒体、微粒体及上清等组分。发现微粒体中的放射性强度最高。再用去污剂,如脱氧胆酸,处理微粒体,将核糖体从内质网中分离出来,发现核糖体的放射性强度比微粒体的要高7倍。这就说明核糖体是合成蛋白质的部位。
核糖体是一个巨大的核糖核蛋白体。在原核细胞中,它可以以游离形式存在,也可以与mRNA结合形成串状的多核糖体。平均每个细胞约有2 000个核糖体。真核细胞中的核糖体既可以以游离状态存在,也可以与细胞内质网相结合形成粗面内质网。每个真核细胞所含核糖体的数目要多得多,为106~107个。线粒体、叶绿体及细胞核内也有自己的核糖体。表12-7中总结了不同生物核糖体的一些组成特性。
表12-7 核糖体的结构组成
核糖体种类
亚基
rRNA(相对分子质量)
蛋白质分子数目
原核细胞核糖体
(以大肠杆菌为例)
30 S
↗
70 S
↘
50 S
16 S (5.5×105)
5 S (0.4×105)
23 S ((110×105)
21
34
真核细胞核糖体
40 S
↗
80S
↘
60 S
18 S (~70×105)
5 S (0.4×105)
28~29 S (140~180×105)
~30
~50
核糖体由两个亚基构成,一个较大,一个较小。当镁离子浓度为10mmol/L时,大、小亚基聚合,镁离子浓度下降至0.1 mmol/L时,又解聚。原核细胞核糖体的30S亚基含有21种蛋白质,还含有一分子16SrRNA。50S亚基中含34种蛋白及5S,23SrRNA各一分子。真核细胞核糖体的40S亚基中有30多种蛋白质及一分子18S rRNA。60S亚基中有50多种蛋白质及5S,28SrRNA各一分子。哺乳类核糖体的60S大亚基中还有一分子5.8S rRNA。
核糖体RNA(rRNA)
核糖体内的所有rRNA在形成核糖体的结构和功能上都起重要作用。rRNA中有很多双螺旋区。图12-7为16S rRNA的二级结构。
16S rRNA在识别mRNA上的多肽合成起始位点中起重要作用。但对rRNA的其他生物学功能还缺少了解。
5S、16S、23S三种rRNA的基因是连在一起的。所以,最初的30S转录产物即rRNA的前体中含有这三种rRNA。30SrRNA前体经过RNaseⅢ的切割形成16S前体rRNA及23S前体rRNA。这些rRNA前体的进一步加工是在与核糖体蛋白相结合后进行的。
图12-7 16S rRNA的二级结构核糖体蛋白
应用双向聚丙烯酰胺凝胶电泳等技术,已成功地将大肠杆菌的核糖体蛋白质进行了分离。大多数蛋白呈纤维状,只有极少数是呈球形的。
核糖体的结构模型
应用电镜及其他物理学方法,已经提出了大肠杆菌30S,50S及70S核糖体的结构模型(图12-8)。70S核糖体为一椭圆球体(13.5 nm×20.0 nm×40.0nm),30S亚基之外形好像一个动物的胚胎,长轴上有一凹下去的颈部,将30S亚基分成头部与躯干两部分。50S亚基之外形很特别,好像一把特殊的椅子,三边带有突起,中间凹下去的部位有一个很大的空穴。当30S与50S亚基互相结合成70S核糖体时,30S亚基水平地与50S亚基相结合,腹面与50S亚基之空穴相抱,它的头部与50S亚基中含蛋白质较多的一侧相结合。两亚基接合面上留有相当大的空隙。蛋白质生物合成可能就在这空隙中进行。
图12-8 原核生物核糖体的功能位点核糖体的大小亚基与mRNA有不同的结合特性。大肠杆菌的30S亚基能单独与mRNA结合形成30S核糖体-mRNA复合体,后者又可与tRNA专一地结合,50S亚基不能单独地与mRNA结合,但可非专一地与tRNA相结合,50S亚基上有两个tRNA位点:A、氨酰基位点(A位点)与肽酰基位点(P位点)。这两个位点的位置可能是在50S亚基与30S亚基相结合的表面上。50S亚基上还有一个在肽酰-tRNA移位过程中使GTP水解的位点。B、在50S与30S亚基的接触面上有一个结合mRNA的位点。此外,C、核糖体上还有许多与起始因子、延伸因子、释放因子及与各种酶相结合的位点。至此,不难看出核糖体是一个多么复杂的结构,它真配得上称为蛋白质合成的工厂。
采用温和的条件小心地从细胞中分离核糖体时可以得到3~4个成串的甚至上百个成串的核糖体,称为多核糖体(polyribosome)。多核糖体是由一个mRNA分子与一定数目的单个核糖体结合而成念珠状。两个核糖体之间有一段裸露的mRNA。每个核糖体可以独立完成一条肽链的合成(见图12-1)。所以在多核糖体上可以同时进行好多条多肽链的合成。这样就提高了翻译的效率。
翻译的步骤
肽链合成是向氨基端(N端)还是向羧基端(C端)延伸的呢?Dintzis等人用3H-亮氨酸作标记分析了兔网织红细胞无细胞体系中血红蛋白生物合成的过程。血红蛋白中含有较多亮氨酸。其氨基酸序列为已知。合成反应在较低温度(15℃)中进行,以降低合成速度。在反应开始后的4~60min内,每隔一定时间取样分析。将带有标记的蛋白质分离出来,用胰蛋白酶水解肽链,用纸层析分离水解碎片并测定所含的放射性强度。实验结果如图12-9所示。从图中可以看出,反应4min后,只有羧基端含有3H-亮氨酸。随着反应时间的延长,带有标记的肽段自羧基端向氨基端延伸,到60min时,几乎整个肽段都布满了标记物。这个实验说明多肽链的合成是从N端向C端进行的。肽链延长的速度极快。兔网织红细胞的一个核糖体合成一条完整的血红蛋白α链(146个氨基酸残基),在37℃时约需3 min。大肠杆菌具有更高的速度,一个核糖体每秒钟可延伸20个氨基酸。
现已经证明,mRNA上信息的阅读(翻译)是从mRNA的5′端向3′端进行的。这方面的实验很多,只举一例。当用下列人工合成的多核苷酸作模板:
5′—pAAA—(AAA)n—AAC—OH—3′
在无细胞体系中进行翻译时,其多肽产物为:
赖氨酰—(赖氨酰)n—天冬酰胺而且,天冬酰胺以羧基为末端,所以它的密码子AAC是最后才被翻译的。这就证明了翻译的方向为5′→3′。由于mRNA从DNA模板的转录作用也是由5′→3′进行的,因此在细胞内当mRNA的转录还没有完成时,翻译工作就可以开始了。
蛋白质合成是最复杂的生物化学过程之一,它包括了上百种不同的蛋白质,以及30多种RNA分子的参与。这一过程开始于氨基酸接在特异的tRNA上,随后的步骤则在核糖体上进行。氨基酸通过tRNA转运到核糖体上,直到氨基酸掺入到多肽链中后tRNA才离开核糖体。
一、氨酰-tRNA合成酶帮助使氨基酸结合到特定的tRNA上(氨基酸的活化)
一种称为氨酰-tRNA合成酶的酶类参与了将氨基酸结合到其对应的tRNA上的过程。这种结合有两方面的意义:①氨基酸与tRNA分子的结合使得氨基酸本身被活化,利于下一步进行的肽键形成反应;②tRNA可以携带氨基酸到mRNA的指定部位,使得氨基酸能够被掺入到多肽链合适的位置。这样,氨酰-tRNA合成酶不仅为蛋白质的合成解决了能量问题,而且还解决了专一性问题。
氨酰-tRNA合成酶参与的合成分两步进行:第一步是氨酰-tRNA合成酶识别它所催化的氨基酸以及另一底物ATP,在氨酰-tRNA合成酶的催化下,氨基酸的羧基与AMP上的磷酸之间形成一个酯键,同时释放出一分子PPi:
氨基酸+ATP→氨酰-AMP+Ppi
这个反应的平衡常数大约为1,以至于ATP分子中磷酸酐键断裂所具备的能量继续保存到了氨酰-AMP分子中。这时,氨酰-AMP仍然紧密地与酶分子结合。
第二个氨酰-tRNA合成酶催化的反应是通过形成酯键将氨基酸连接到tRNA 3′端的核糖上:
氨酰-AMP+tRNA→氨酰-tRNA+AMP
氨酰-tRNA合成酶之间在识别tRNA的部位上有所不同。一些氨酰-tRNA合成酶能特异形成
2′形式的酯,有的形成3′形式的酯,有的还可能形成混合物。一旦结合到最末端的核糖上后,氨酰基团还能在2′或3′的羟基之间进行交换,但只有3′形式的酯才参与在核糖体催化下的下面的转肽反应。
上面两个由氨酰-tRNA合成酶催化的反应可总结如下式:
氨基酸+ATP+tRNA → 氨酰-tRNA+AMP+PPi
最后的这个总反应的平衡常数近于1,自由能降低极少,反应是可逆的。但随着PPi被焦磷酸酶水解成两个自由磷酸分子,上述反应就趋向于完全。氨基酸与核糖之间形成的高能酯键对于蛋白质合成中肽键的形成十分重要。
1、每一个氨酰-tRNA合成酶可识别一个特定的氨基酸和与此氨基酸对应的tRNA的特定部位
对应于20种氨基酸的每一种氨基酸,大多数细胞都只含有一种与之对应的氨酰-tRNA合成酶,每一种氨酰-tRNA合成酶既能够识别相应的氨基酸,又能识别与此氨基酸相对应的一个或多个tRNA分子。有时,还把氨酰-tRNA合成酶和与之对应的tRNA分子叫做“遗传密码第二”。
通过对氨酰-tRNA合成酶识别tRNA反密码子的专一性的分析,可将它们分成两类:一类可识别反密码子,一类则不能。这一差别可由如下理由来理解。有的tRNA在遗传上其反密码子发生了改变,但其氨酰-tRNA合成酶对它的识别却没有发生改变。与此类似,一些tRNA的反密码子即使被化学方法改变,它们仍能被其相应的氨酰-tRNA合成酶所识别。然而,另一些氨酰-tRNA合成酶则不能识别反密码子发生了变化的tRNA。
tRNA的氨基酸接受臂处于酶活性部位,与ATP结合部位邻近。通过与酶分子的结合,tRNA 3′端的氨基酸接受臂的CCA有较大的构象变化,这种构象变化似乎可使得在末端的AU配对解链,以利于末端碱基与酶分子发生作用。在这一点上看,酶分子对tRNA的识别是特异和复杂的。
2、氨酰-tRNA合成酶能够纠正酰化的错误
许多氨酰-tRNA合成酶似乎含有第二个活性部位,叫做校正部位,用于水解非正确组合的氨基酸和tRNA之间形成的共价联系,这一纠错过程可用异亮氨酰-tRNA合成酶来加以说明。异亮氨酸与缬氨酸只有一个甲基的差异,较难区别。异亮氨酰-tRNA合成酶能够在酰化部位区分这两种氨基酸,然而也会偶尔生成缬氨酰-tRNAIle。当异亮氨酰-tRNA合成酶遇到缬氨酰-tRNAIle时,它的水解活性部位会将其水解掉:
缬氨酰-tRNAIle+H20→缬氨酸+tRNAIle
这样,缬氨酸取代异亮氨酸的错误掺入就可以通过异亮氨酰-tRNA合成酶的水解活性得到避免。经过氨基酰化部位以及校正部位的共同作用,可使翻译过程的错误频率小于万分之一。
二、肽链合成的起始
1、一个特殊的tRNA启动了蛋白质的合成(起始氨基酸及起始tRNA)
所有蛋白质的翻译开始于甲硫氨酸的参与,一个特殊的起始tRNA对所有蛋白质合成中起始氨基酸——甲硫氨酸的掺入负责,这个tRNA可简写为tRNAMet,它也对选择在mRNA上的什么位置开始翻译起重要作用。通常,细胞中只有两种tRNA可携带甲硫氨酸,既原核细胞起始的tRNA为tRNAf,它携带甲酰甲硫氨酸(fMet),另一种携带甲硫氨酸掺入到蛋白质内部的tRNA写作tRNAm,它携带甲硫氨酸(Met)。
在原核细胞中,有一种特异的甲酰化酶,能够使得tRNAMet中的氨基发生甲酰化,这样可使得参与起始的tRNAfMet不参与肽链的延伸过程。这种识别过程在进化过程中逐渐消失,在真核细胞中是不存在的。真核细胞的起始tRNA为tRNA i,起始氨基酸为Met。
2、翻译开始于mRNA与核糖体的结合
蛋白质合成中翻译的开始需要在mRNA分子上选择合适位置的起始密码AUG,这一过程可通过核糖体小亚基与mRNA的结合来完成。原核与真核生物在识别合适的起始密码上有所差别,这种差别源于原核与真核生物mRNA的差异。对于真核生物mRNA而言,它通常只编码一个蛋白质,而原核生物mRNA通常可为多个蛋白质编码(见图12-3)。
在真核生物的mRNA中,最靠近5′端的AUG序列通常是起始密码。核糖体小亚基首先结合在mRNA的5′端,然后向3′端移动,直到AUG序列被tRNAiMet上的反密码子识别。在除酵母以外的高等真核生物中,这种识别为类似GCCGCCpurCCAUGG这样序列所加强,核糖体与它怎样进行的识别过程目前尚不清楚,但可以肯定的是,如没有这样类似的序列,40S小亚基将不能识别AUG,而是继续向3′移动,识别到含有类似序列的AUG时才开始翻译。
在原核细胞中,起始AUG可以在mRNA上的任何位置,并且一个mRNA上可以有多个起始位点,为多个蛋白质编码。原核细胞中的核糖体是如何对mRNA分子内如此众多的AUG起始位点进行识别的?Shine和Dalgarno在20世纪70年代初期解答了这个问题。他们发现,细菌的mRNA通常含有一段富含嘌呤碱基的序列,现被称作SD序列,它们通常在起始AUG序列上游10个碱基左右的位置,能与细菌16S核糖体RNA 3′端的7个嘧啶碱基进行碱基互补性的识别,以帮助从起始AUG处开始翻译,如表12-8所示。这种识别已被证实是细菌中识别起始密码的主要机制,在SD序列上发生增强碱基配对的突变能够加强翻译,反之,发生减弱碱基配对的突变则会减弱翻译的效率。
表12-8 大肠杆菌16S rRNA与SD序列的识别
与SD序列互补的嘧啶碱基富含区
16S rRNA
lacZ mRNA
trpA mRNA
RNA polymerase βmRNA
r-Protein L10 mRNA
3′…HOAUUCCUCCACUA…5′
5′…ACACAGGAAACAGCUAUG…3′
5′…ACGAGGGGAAAUCUGAUG…3′
5′…GAGCUGAGGAACCCUAUG…3′
5′…C CAGGAGCAA AGCUAAUG…3′
SD序列的重要性还可以通过细菌毒素colecin E3的作用机制来说明。这个毒素可通过核酸酶的活性特异地在16S rRNA 3′端切下50个碱基左右的片段,使得核糖体小亚基中的16S rRNA失去了与mRNA上SD序列互补的序列,由此抑制了细菌蛋白质的合成。由于原核生物与真核生物在蛋白质合成起始机制上的差异,colecin E3并不影响真核生物核糖体的功能。
3、蛋白质因子帮助的蛋白质合成起始(蛋白质合成起始复合物的的合成)
在核糖体上的蛋白质合成可分成起始、延长及终止3个不同阶段,每一阶段都涉及到一组不同的蛋白质因子。虽然原核生物与真核生物在蛋白质合成的起始上有差异,但是有三点是大家都要进行的:① 核糖体小亚基结合起始tRNA;② tRNA在mRNA上必需要找到合适的起始密码子;③ 大亚基必须与已经形成复合物的小亚基、起始tRNA、mRNA结合。一些被称作起始因子(initiation factor,IF)的非核糖体蛋白质参与了上述3个过程。这些起始因子不同于核糖体蛋白质,它们仅是临时性地与核糖体发生作用参与蛋白质的起始,之后会从核糖体复合物上解离下来,而核糖体蛋白质则是一直结合在同一核糖体上。
大肠杆菌有3个起始因子(图12-11)与30S小亚基结合。其中IF-3的功能是使前面已结束蛋白质合成的核糖体的30S和50S亚基分开,其他两个起始因子IF-1及IF-2的功能则是促进fMet-tRNAifMet及mRNA与30S小亚基的结合。正如前面已谈到的,mRMA上的SD序列可与小亚基上16S rRNA的3′进行碱基配对,起始密码子AUG可与起始tRNA上的反密码子进行配对。当30S小亚基结合上fMet-tRNAifMet及mRNA形成复合物后,IF-3就解离开来,以便50S大亚基与复合物结合。这一结合使得IF-1及IF-2离开核糖体,同时使结合在IF-2上的GTP发生水解。原核生物的起始过程需要一分子的GTP水解成GDP及磷酸以提供能量。
图12-11 原核生物蛋白质合成起始复合物的形成
图12- 12 真核生物蛋白质合成起始复合物的形成
真核生物蛋白质合成的起始需要更多的蛋白质因子(elF)参与,目前,至少已发现9种,其中有一些因子含有多达11种不同的亚基,我们迄今只知道部分因子的功能。主要的过程如图12-12所示。与原核系统类似,elF-3使得40S小亚基与大亚基分开,而且也是通过GTP的水解使大小亚基结合,然而其间的反应则有所不同。Met-tRNAiMet首先与小亚基结合,同时与elF-2及GTP形成四元复合物,形成的复合物在多个因子的帮助下开始与mRNA的
5′端结合。其中一个因子elF-4含有一个亚基,能够特异性地结合在mRNA的帽子结构上。结合上mRNA后,核糖体小亚基就开始向3′端移动至第一个AUG。这种移动由ATP水解为ADP及磷酸来提供能量。
三、在氨基酸的掺入过程中有3个重复的延伸反应(肽链的延伸)
当起始过程结束后,mRNA上接下来的密码子的翻译则由3个重复的反应来完成一个氨基酸的掺入(入位、形成肽键、移位)。这3个延长反应在原核和真核生物中是相似的,其中两个需要非核糖体蛋白的延长因子(elongation factor,EF)的参与。值得指出的是,肽键的形成并不需要任何蛋白质因子的参与,而是靠核糖体自身催化完成的,这也是蛋白质合成过程中,核糖体参与催化的唯一反应。
图12-13 原核生物蛋白质合成中第二个氨酰-tRNA加入的过程
当与起始密码子紧邻的密码子被氨酰-tRNA上的反密码子识别并结合后,延长反应也就开始了。氨酰-tRNA的结合由氨酰-tRNA结合因子催化,在细菌中简写为EF-Tu,在真核系统中为EF-1。这个因子可与结合有氨酰-tRNA和GTP的核糖体形成四元复合物,同时偶联上GTP的水解。随着氨酰-tRNA与核糖体的结合,EF-Tu则与GDP形成复合物离开核糖体。第二个延长因子EF-Ts则负责催化EF-Tu-GTP复合物的再形成,为结合下一个氨酰-tRNA作准备,以上过程如图12-13所示。EF-1是一个多亚基的蛋白,同时具备了EF-Tu及EF-Ts的性质。
肽键在延长因子从核糖体上解离下来之后马上就形成了,这一过程叫做转肽(transpeptidation),催化这一过程的酶叫肽酰转移酶(peptidyl transferase),它催化的实质是使一个酯键转变成了一个肽键。转肽过程可看作是新加入的氨酰-tRNA上氨基酸的氨基对肽酰-tRNA上酯键的羰基作亲核进攻,如图12-14所示。
嘌呤霉素对蛋白质合成的抑制作用就发生在这一步上。嘌呤霉素的结构与氨酰 -tRNA 3′端上的AMP残基的结构十分相似。肽酰转移酶也能促使氨基酸与嘌呤霉素结合,形成肽酰嘌呤霉素,但其连键不是酯键,而是酰胺键。肽酰-嘌呤霉素复合物很易从核糖体上脱落,从而使蛋白质合成过程中断。这一点不仅证明了嘌呤霉素的作用机制,也说明了活化氨基酸是添加在延伸肽链的羧基上的。
延长过程中的最后一步叫做移位(translocation) (图12-15),如同氨酰-tRNA的结合,这一过程由移位因子催化(原核中为EF-G,真核中为EF-2),此过程有GTP的水解。移位的目的是使核糖体沿mRNA移动.使下一个密码子暴露出来以供继续翻译。
核糖体反应中GTP的作用,
GTP的水解在翻译过程中具有重要的作用,在每掺入一个氨基酸的延长过程中,都有两个GTP分子发生了水解,这相当于整个这一过程消耗的能量的一半。GTP水解过程可通过EF-Tu和EF-G的作用来理解,GTP的结合与水解都在这些因子上进行,这些因子和GTP的复合物与核糖体的作用,才激活了水解部位的活性。随着GTP水解成GDP,这些因子的构象将发生变化,与核糖体分离。GTP及GDP与这些因子的结合与否,成了调节这些因子与核糖体结合的开关。这一过程可通过GTP的类似物GMPPCP来说明。这个类似物在β和γ磷酸基团之间不含氧,而是一个亚甲基,因此难以发生类似GTP生成GDP的过程。在延长反应中,当用GMPPCP取代GTP后,延长反应变慢,这是因为没有GDP的生成延长因子很难与核糖体发生解离。
图12-15 原核生物蛋白质合成中的移位与GTP发生作用的翻译因子属于G蛋白家族,所有的G蛋白都能结合并水解GTP,并且遵从类似的机制,当与GTP结合后,这些蛋白被激活,当结合上水解来的GDP后,就变成无活性的构象。
四、翻译的终止需要释放因子和终止密码子的参加(肽链合成的终止与释放)
翻译的最后一步涉及到合成好的肽酰-tRNA中连接tRNA和C端氨基酸的酯键的切开(图12-16),这一过程除了需要终止密码子外,还需要释放因子(release factors,RFs)的参加。在这一过程中,核糖体与mRNA的解离还需要核糖体释放因子(ribosome releasing factor,RRF)的参与。
细胞通常不含能够识别3个终止密码子的tRNA。在大肠杆菌中,当终止密码子进入核糖体上的A位点后,它们就被释放因子识别。RF-1识别UAA和UAG,RF-2识别UAA和UGA,RF-3不识别终止密码子,但能刺激另外两个因子的活性。当释放因子识别在A位点上的终止密码子后,将改变在大亚基上的肽酰转移酶的专一性,使其能结合水用于亲核进攻,而不是识别通常的底物氨酰-tRNA。换言之,终止反应实际上是将肽酰转移酶活性转变成酯酶活性。图12-17显示在体外实验中,当大肠杆菌的核糖体与fMet-tRNAiMet、RF-1、两个三聚核苷酸AUG和UAA混合后,通过水解,甲酰蛋氨酸得到了生成。
五、核糖体在翻译中能跳跃式读码通常,核糖体对密码子的识别是从起始AUG开始,一个接一个地按顺序进行识别,直到终止密码子,使得翻译严格地按一个读码框架进行。然而,在原核和真核生物中,也有一些例外的情况,翻译中读码框发生了位移(translational frameshifting)。这种位移通常表现为一个碱基位移。但也有核糖体跳过一大段mRNA(如50个碱基)后继续翻译的,这一过程常叫做翻译跳跃(translational jumping)。从遗传信息流方面来看,翻译跳跃类似于mRNA的剪接,只不过遗传信息没有像mRNA的剪接那样被切掉,而是被核糖体忽略掉了。不论是翻译位移还是翻译跳跃,它们都发生在mRNA的特殊位置,这些位置通常会有特殊的序列和结构。虽然人们对特殊的位置和结构已有所掌握,但对核糖体是怎样进行识别的尚不太清楚。
图12-16 原核生物蛋白质合成中新生肽链释放
第四节 蛋白质的运输及翻译后修饰
在核糖体上新合成的多肽被送往细胞的各个部分,以行使各自的生物功能,大肠杆菌新合成的多肽,一部分仍停留在胞浆之中,一部分则被送到质膜、外膜或质膜与外膜之间的空隙,有的也可分泌到胞外。真核细胞中新合成的多肽被送往溶酶体、线粒体、叶绿体胞核等细胞器。所以新合成的多肽的输送是有目的、定向地进行的。尽管蛋白质生物合成中遗传密码只指导20种氨基酸的掺入,然而,对于成熟蛋白质的分析表明,可发现上百种氨基酸的存在,但它们也只是在20种氨基酸基础上衍生出来的。这种翻译后加工过程使得蛋白质组成更加多样化,从而导致蛋白质结构上呈现更大的复杂化。我们关于后加工过程的知识还十分有限。除了对氨基酸残基的侧链基团进行修饰外,还有合成出的部分肽段在蛋白质成熟过程中被切除。这些修饰和加工过程是与这些蛋白质是在什么部位合成的,要运送到什么部位去有关。其实,加工过程在多肽链合成开始即随之进行。在多核糖体上合成的蛋白质或者留在细胞质中,或者运送到细胞器。留在细胞质中的蛋白质从核糖体上释放后即可行使其功能,而运往别处的蛋白质则往往在运送的过程中发生大量的修饰。许多由结合在膜上的多核糖体合成出来的蛋白质或者停留在ER膜上,或者被运往高尔基体、分泌小泡、质膜或溶酶体。
一、蛋白质通过其信号肽引导到目的地
蛋白质的运输尽管比较复杂,但生物系统中的蛋白质的运输可用一个比较简单的模式来解释。每一需要运输的多肽都含有一段氨基酸序列,称为信号肽序列(signal or leader sequence),引导多肽至不同的转运系统。在真核细胞中,当某一种多肽的N端刚开始合成不久,这种多肽合成后的去向就已被决定。一部分核糖体以游离状态停留在胞浆中,它们只合成供装配线粒体及叶绿体膜的蛋白质。另一部分核糖体受新合成的多肽的N端上的信号肽(signal sequence)所控制而进入内质网,使原来表面平滑的内质网(smooth ER)变成有局部凸起的粗面内质网(rough ER)。与内质网相结合的核糖体可合成三类主要的蛋白质:溶酶体蛋白,分泌到胞外的蛋白和构成质膜骨架的蛋白。信号肽的概念首先是由Salatini D.和Blobel G.所提出的。以后,Milstein C.和Brownlee G.在体外合成的免疫球蛋白肽链的N端找到了这种信号肽。当时,只是在体外合成的未经加工的免疫球蛋白上找到了信号肽,但不能在体内合成的经过加工的成熟免疫球蛋白上找到它。因为在体内合成后的加工过程中,信号肽被信号肽酶(signal peptidase)切掉了。许多蛋白质激素就是以前体蛋白形式合成的,例如,胰岛素mRNA通过翻译,可得到前胰岛素原蛋白,其前面的23个氨基酸残基的信号肽在转运至高尔基体的过程中被切除。以后在很多真核细胞的分泌蛋白中都发现有信号肽。
信号肽序列通常在被转运多肽链的N端,这些序列在10~40个氨基酸残基范围,氨基端至少含有一个带正电荷的氨基酸,在中部有一段长度为10~15个氨基酸残基的由高度疏水性的氨基酸组成的肽链,常见的为丙氨酸、亮氨酸、缬氨酸、异亮氨酸和苯丙氨酸。这个疏水区极重要,其中某一个氨基酸被非极性氨基酸置换时,信号肽即失去功能。疏水序列表明,一般蛋白质是很难通过脂膜的,而信号肽可引导它至特定的细胞器,并通过膜。什么样的序列能指导蛋白质转运至什么细胞器,目前还没有完全阐明。在信号肽的C端有一个可被信号肽酶识别的位点,此位点上游常有一段疏水性较强的5肽,信号肽酶切点上游的第一个(-1)及第三个(-3)氨基酸常为具有一个小侧链的氨基酸(如丙氨酸)。图12-18为一些真核细胞多肽的信号肽结构。
切点人生长激素 MATGSRTSLLLAFGLLCLPWLQEGSA FPT
人胰岛素原 MALWMRLLPLLALLALWGPDPAAA FVN
牛血清蛋白原 MKWVTFISLLLFSSAYS RGV
小鼠抗体H链 MKVLSLLYLLTAIPHIMS DVQ
鸡溶菌酶 MKSLLILVLCFLPKLAALG KVF
蜂毒蛋白 MKFLVNVALVFMVVYISYIYA APE
果蝇胶蛋白 MKLLVVAVIACMLIGFADPASG CKD
玉米蛋白19 MAAKIFCLIMLLGLSASAATA SIF
酵母转化酶 MLLOAFLFLLAGFAAKISA SMT
人流感病毒A MKAKLLVLLYAFVAG DQI
图12-18 一些真核细胞多肽氨基端的信号肽结构疏水氨基酸残基以粗体字母表示,碱性氨基酸残基用下划线字母表示信号肽的位置也不一定在新生肽的N端,有些蛋白质(如卵清蛋白)的信号肽位于多肽链的中部,但其功能则相同,那么信号肽又是由什么蛋白质加以识别的呢?Blobel等已证明,识别信号肽的是一种核蛋白体,称为信号识别体(signal recognition particle,SRP)。SRP的相对分子质量为325 000,由一分子7SL RNA(长300核苷酸)和6个不同的多肽分子组成。7SL RNA上有两段核苷酸序列,称为Alu序列。Alu序列在哺乳类DNA中颇为常见。SRP有两个功能域,一个用以识别信号肽,另一个用以干扰进入的氨酰-RNA和肽酰移位酶的反应,以终止多肽链的延伸作用。信号肽与SRP之结合发生在蛋白质合成刚一开始时,即N端的新生肽链刚一出现时,一旦SRP与带有新生肽链的核糖体相结合,肽链的延伸作用暂时终止,或延伸速度大大减小。SRP-核糖体复合体就移动到内质网上并与那里的SRP受体停泊蛋白(docking protein)相结合。一旦与此受体相结合后,蛋白质合成的延伸作用又重新开始。SRP受体是一个二聚体蛋白,由相对分子质量为69 000的α亚基与相对分子质量为30 000的β亚基组成。然后带有新生肽链的核糖体被送入多肽移位装置(translocation machinery)。同时,SRP又被释放到胞浆中,新生肽链又继续延长。移位装置含有两个膜本体蛋白(integral membrane protein):ribophorinⅠ和Ⅱ。
上述整个过程总结于图12-19中。
图12-19 信号肽的识别过程
二、一些线粒体、叶绿体蛋白质是翻译完成后被运输的
线粒体DNA基因组可编码全部线粒体RNA,但只编码一小部分线粒体蛋白。叶绿体的情形也相似。大部分线粒体和叶绿体的蛋白质是由细胞核基因组DNA编码的,并在胞浆内由游离核糖体合成这些蛋白质,再送到这些细胞器中去,这种运输被称作翻译后运输(posttranslational transport)。在这一过程中,为了过膜,这些蛋白质需要通过多肽链结合蛋白(polypeptide chain binding proteins,PCBs)的帮助进行去折叠。往线粒体进行的翻译后运输需要ATP和质子梯度,以帮助蛋白质去折叠和跨膜。
图12-20 细胞色素前体蛋白通过两个信号肽序列的连续跨膜过程由核基因组织编码的线粒体外膜蛋白的N端上也有一段肽链,称为线粒体定向肽,起信号肽的作用。它可以与外膜上的相应位点相识别。线粒体定向肽富含带正电荷的氨基酸和丝氨酸、苏氨酸。
MLKTSSLFTRRUQPSLFRNILRLQST—
(线粒体定向肽)
从胞质往线粒体内运送蛋白质的过程较为复杂,因为线粒体本身具有多膜的结构。如图12-20所示,细胞色素c1前体蛋白的N端有两个信号肽序列。第一个序列被线粒体外膜上的受体蛋白识别,引导至膜上的运输通道并得以进入线粒体内的基质中,这时第一个信号肽被切除。随之,第二个信号肽用与第一个信号肽相似的方式携带多肽穿过内膜,之后第二个信号肽被切除,细胞色素c1则折叠成其天然结构,并结合上一个血红素分子。在胞质中合成的叶绿体蛋白质的运输与线粒体蛋白非常类似,叶绿体新生肽的定向输送也是由N端上的一段肽链决定的,这种肽称为叶绿体转移肽。
三、分泌型的真核蛋白在内质网(endoplasmic reticulum,ER)内合成
在真核细胞中,内质网是最大的模状结构的细胞器,其表面积可以是质膜面积的几倍。大部分的内质网与核糖体相结合形成粗面内质网。在粗面内质网上的核糖体是膜蛋白和分泌性蛋白合成的地方,也是蛋白质分泌途径的起点。多肽经移位后,在内质网的小腔中被修饰。这些修饰作用包括N端信号肽的切除和二硫键形成,使线形多肽呈现一定空间结构及糖基化作用。在内质网的膜及内腔有一些特殊的参与加工分泌蛋白和膜蛋白的蛋白质,如蛋白质二硫键异构酶。通过短时间内在粗面内质网内加工后,分泌蛋白形成被膜包裹的小泡,转运至高尔基体,然后再转运至细胞表面或溶酶体中。
糖基化作用使多肽链转变成糖蛋白。许多膜本体蛋白及抗原蛋白都是糖蛋白。糖蛋白中的糖苷键有两类:一类是肽链上天冬酰胺侧链上的N原子与寡聚糖核之间构成的N-糖苷键;另一类是肽链上丝氨酸、苏氨酸侧链上的氧原子与寡聚糖核之间构成的O-糖苷键。通常在糖蛋白上发现的寡聚糖核(oligosaccharide core)是五聚糖。其成分为3分子甘露糖及2分子N-乙酰胺基葡萄糖。寡聚糖核是如何被带到蛋白质上的呢?已证明携带的载体是长萜醇的磷酸酯(dolichol phosphate)。它是一条具有很长的烃链的磷酸酯,末端的磷酸基可与核糖结合。
四、高尔基体中多肽的糖基化修饰及多肽的分类
高尔基体主要有两方面功能:一是对糖蛋白上的寡聚糖核作进一步修饰与调整;二是将各种多肽进行分类并送往溶酶体、分泌粒(granule)和质膜等目的地。但是何种蛋白质应送往何处是由蛋白质本身的空间结构决定的。
高尔基体是由许多层袋状的膜结构组成的。糖蛋白的进一步糖基化修饰就是在这种膜结构中完成的。以溶酶体中的酶类的输送为例,由于这些酶类自身构象的变化可与6-磷酸甘露糖酯相结合,后者可被高尔基体膜上的受体识别,最终使这些酶-糖蛋白进入溶酶体。所以,6-磷酸甘露糖酯是一种导向标志,指挥糖蛋白的运输方向。但6-磷酸甘露糖酯对分泌蛋白与质膜蛋白并不起导向标志的作用。
五、大肠杆菌蛋白质在翻译的同时也在被运输
细菌中新生肽的定向输送的情形相对于真核细胞来说较为简单,在细胞质中合成出来的多肽可以就在合成部位,或被整合到质膜上,或通过质膜分泌出来行使功能。大多数非细胞质细菌蛋白在核糖体上合成的同时也在被运送至质膜或跨过膜,这一过程称为翻译中运输(cotranslational transport)。这一过程有一组帮助多肽分泌的蛋白质参与,它们中有些是能识别新生肽链N端引导肽序列(1eader sequence)的膜蛋白,可将正在翻译的核糖体拉至质膜,使合成的多肽得到转运。这段引导肽也可被引导肽酶(1eader peptidase)切除,使多肽能够分泌出细胞。
蛋白质的生物合成在细胞代谢中占有十分重要的地位。目前已经完全清楚,贮存遗传信息的DNA并不是蛋白质合成的直接模板,DNA上的遗传信息需要通过转录传递给mRNA。mRNA才是蛋白质合成的直接模板。mRNA是由4种核苷酸构成的多核苷酸,而蛋白质是由20种左右的氨基酸构成的多肽,它们之间遗传信息的传递与从一种语言翻译成另一种语言时的情形相似。所以人们称以mRNA为模板合成蛋白质的过程为翻译或转译(translation)。
翻译的过程十分复杂,几乎涉及到细胞内所有种类的RNA和几十种蛋白质因子。蛋白质合成的场所是核糖体,合成的原料是氨基酸,反应所需能量由ATP和GTP提供。蛋白质合成的早期研究工作都是用大肠杆菌的无细胞体系进行的,所以对大肠杆菌的蛋白质合成机理了解最多。真核细胞蛋白质合成的机理与大肠杆菌的有许多相似之处。
第一节 遗传密码任何一种天然多肽都有其特定的严格的氨基酸序列。有机界拥有1010~1011种不同的蛋白质,构成数目这么庞大的不同的多肽的单体却只有20种氨基酸。氨基酸在多肽中的不同排列次序是蛋白质多样性的基础。目前已经清楚,多肽上氨基酸的排列次序最终是由DNA上核苷酸的排列次序决定的,而直接决定多肽上氨基酸次序的却是mRNA。不论是DNA还是mRNA,基本上都由4种核苷酸构成。这4种核苷酸如何编制成遗传密码,遗传密码又如何被翻译成20种氨基酸组成的多肽,这就是蛋白质生物合成中的遗传密码的翻译问题。
一、密码单位
用数学方法推算,如果mRNA分子中的一种碱基编码一种氨基酸,那么4种碱基只能决定4种氨基酸,而蛋白质分子中的氨基酸有20种,所以显然是不行的。如果由mRNA分子中每2个相邻的碱基编码一种氨基酸,也只能编码42=16种氨基酸,仍然不够。如果采用每3个相邻的碱基为一个氨基酸编码,则43=64,可以满足20种氨基酸编码的需要。所以这种编码方式的可能性最大。应用生物化学和遗传学的研究技术,已经充分证明了是mRNA上三个相邻的碱基编码一个氨基酸。所以叫三联体密码或密码子(codon)。
首先介绍一下生物化学方面的证明。1961年Nirenberg等用大肠杆菌无细胞体系,外加20种标记氨基酸混合物及Poly U,经保温反应后,发现只有苯丙氨酸的多聚体。显然Poly U起了信使RNA的作用。所以UUU是编码苯丙氨酸的密码子。
进一步,Nirenberg和Ochoa等用Poly UG和Poly AC重复上述类似实验,发现标记氨基酸掺入新合成的肽链的频率与按统计学方法推算出的多核苷酸中三联体密码出现的频率相符合(表12-1)。应用这种方法,很快确定了为20种氨基酸编码的全部密码子。
表12-1 无序Po1y UG对氨基酸的编码(U:G=5:1)
可能的密码子
按计算可能出现的频率*
氨基酸掺入的相对量
UUU
100
Phe (100)
UUG
UGU
GUU
20
Cys (20)
Val (20)
UGG
GUG
GGU
4
G1y (4)
Trp (5)
GGG
0.8
—
* 以UUU的出现频率为100计。
进一步要解决的问题是密码子中三个碱基的排列次序问题。1964年Nirenberg等应用大肠杆菌核糖体与人工合成的多聚核苷酸、Mg2+及一种与人工模板上密码子相对应的氨酰-tRNA(只缺GTP)一起保温。由于反应体系中无GTP,掺入的氨基酸不可能形成多肽。应用这种方法,发现具有密码子功能的最短链为三核苷酸,最有效的是3′-OH和5′-磷酸基的三核苷酸。3′-磷酸基为末端的三核苷酸无模板功能。所以密码子的读法是有方向的。如pGpUpU对缬氨酸专一,而UpUpGp却对亮氨酸专一。
当应用合成的三核苷酸重复序列作模板时,得到很有意义的结果。如以Po1y UUC作模板时,得到的产物是三种不同的多肽:多聚苯丙氨酸、多聚丝氨酸和多聚亮氨酸。这是因为从不同的碱基开始阅读密码所引起的:
UUC-UUC-UUC-UUC-UUC——编码苯丙氨酸
UCU-UCU-UCU-UCU-UCU——编码丝氨酸
CUU-CUU-CUU-CUU-CUU——编码亮氨酸
表12-2列出了应用带有重复序列的人工合成的多核苷酸模板与掺入的氨基酸之间的关系。
应用上述方法,仅用了4年时间,于1965年完全确定了编码20种天然氨基酸的60多组密码子,编出了遗传密码字典(表12-3)。
表12-2 带重复系列的人工多核苷酸模板与掺入的氨基酸之间的关系重复序列
多核苷酸中的密码子
掺入的氨基酸
UC
AG
UG
AC
UUC
AAG
GAU
UAC
GUA
UAUC
UUAC
UCU,CUC
AGA,GAG
UGU,GUG
ACA,CAC
UUC,UCU,CUU
AAG,AGA,GAA
GAU,AUG,UGA
UAC,ACU,CUA
GUA,UAG,AGU
UAU,CUA,UCU,AUC
UUA,CUU,ACU,UAC
Ser,Leu
Arg,Glu
Cys,Val
Thr,His
Phe,Ser,Leu
Lys,Arg,Glu
Asp,Met
Tyr,Thr,Leu
Val,Ser
Tyr,Leu,Ser,Ile
Leu,Thr,Tyr
5′-磷酸末端
中 间 的 碱 基
3′-OH基末端的碱基
的碱基
U
C
A
G
U
U
苯丙氨酸
苯丙氨酸
亮氨酸
亮氨酸
丝氨酸
丝氨酸
丝氨酸
丝氨酸
酪氨酸
酪氨酸
终止信号
终止信号
半胱氨酸半胱氨酸
终止信号
色氨酸
C
A
G
U
C
亮氨酸
亮氨酸,
亮氨酸
亮氨酸
脯氨酸
脯氨酸
脯氨酸
脯氨酸
组氨酸
组氨酸
谷酰胺
谷酰胺
精氨酸
精氨酸
精氨酸精氨酸
C
A
G
U
A
异亮氨酸
异亮氨酸
异亮氨酸
甲硫氨酸和甲酰甲硫氨酸
苏氨酸
苏氨酸
苏氨酸
苏氨酸
天冬酰胺
天冬酰胺
赖氨酸
赖氨酸
丝氨酸
丝氨酸
精氨酸
精氨酸
C
A
G
U
G
缬氨酸
缬氨酸缬氨酸缬氨酸
丙氨酸
丙氨酸
丙氨酸
丙氨酸
天冬氨酸
天冬氨酸谷氨酸谷氨酸
甘氨酸
甘氨酸甘氨酸甘氨酸
C
A
G
表12-3 遗传密码字典*
*密码子的阅读方向5′→3′,AUG为起始密码子。
用遗传学方法也证明了遗传信息是三联体密码。用某些吖啶染料可以引起T4噬菌体DNA插入或删去1、2或3个碱基。实验的原理可用假设的噬菌体DNA加以说明。
删去碱基的数目:
0 CAT CAT CAT CAT CAT CAT CAT
1 CAT CTC ATC ATC ATC ATC ATC
↓
A
2 CAT CTC ACA TCA TCA TCA TCA
↓ ↓
A T
3 CAT CTC ACA TAT CAT CAT CAT
↓ ↓ ↓
A T C
当删去一个碱基A时,从这一点以后的密码就发生了差错。删去两个碱基时,情形也如此。但是删去三个碱基时,情况就不同了。最先也形成几组错误的密码子,但以后又恢复正常。前面两类突变往往使基因产物全部失去活力,而第三种突变类型使基因产物仍具有一定活力。这只能用遗传密码是三联体这个事实来加以解释。
二、遗传密码的基本特性
1.密码无标点符号
即两个密码子之间没有任何起标点符号作用的密码子加以隔开,因此,要正确阅读密码必须按一定的读码框架从一个正确的起点开始,一个不漏地挨着读下去,直至碰到终止信号。若在遗传密码中插入或删去一个碱基,就会使这以后的读码发生错误,这称为移码。由移码引起的突变称为移码突变。
2.一般情形下遗传密码不重叠
假设mRNA上的核苷酸序列为ABCDEFGHIJKL……,按不重叠规则读码时应读为ABC DEF GHI JKL等,每三个碱基编码一个氨基酸,碱基的使用不发生重复:
ABC DEF GHI JKL
…aa1….,aa2……aa3…..aa4…,
如果按完全重叠规则读码,则应该是ABC编码aa1,BCD编码aa2,CDE编码aa3,……。目前已经证明,在绝大多数生物中,读码规则是不重叠的。
3.密码的简并性(Clegeneracy)
大多数氨基酸都可以具有几组不同的密码子,如UUA、UUG,CUU、CUC、CUA及CUG6组密码子都编码亮氨酸。这一现象称为密码的简并。可以编码相同氨基酸的密码子称为同义密码子(synonymcodon)。只有色氨酸及甲硫氨酸只有一个密码子(表12-4)。密码的简并性在生物物种的稳定性上具有一定意义。
4.密码子中第三位碱基具有较小的专一性 ( 遗传密码的“摆动性”)
密码的简并性往往只涉及第三位碱基。如丙氨酸有4组密码子:GCU、GCC、GCA、GCG,前两位碱基都相同,均为GC,只是第三位不相同。已经证明,密码子的专一性主要由前两位碱基决定,第三位碱基的重要性不大。Crick对第三位碱基的这一特性给予一个专门的术语,称为“摆动性”。当第三位碱基发生突变时,仍能翻译出正确的氨基酸来,从而使合成的多肽仍具有生物学活力。特别应该指出的是:tRNA的反密码子中,除A、U、G、C4种碱基外,还经常出现次黄嘌呤I。次黄嘌呤的特点是,与U、A、C三者之间都可以配对,这就使得凡带有I 碱基的反密码子都具有阅读mRNA上密码子的非凡能力,从而减少了由于遗传密码突变而引起的误差。
表12-4 氨基酸密码子的简并
氨 基 酸
密码子数目
氨 基 酸
密码子数目
丙氨酸
精氨酸
天冬酰胺
天冬氨酸
半胱氨酸
谷酰胺
谷氨酸
甘氨酸
组氨酸
异亮氨酸
4
6
2
2
2
2
2
4
2
3
亮氨酸
赖氨酸
甲硫氨酸
苯丙氨酸
脯氨酸
丝氨酸
苏氨酸
色氨酸
酪氨酸
缬氨酸
6
2
1
2
4
6
4
1
2
4
这一点已经得到实验证明。酵母tRNAAla的反密码子为IGC,可阅读GCU、GCC、GCA几组密码子,
反密码子:3′-C-G-I-5′ 3′-C-G-I-5′ 3′-C-G-I-5′
,::,::,::
密码子,5′-G-C-U-3′ 5′-G-C-C-3′ 5′-G-C-A-3′
tRNA反密码子上的G、U可分别与密码子上的U、C和G、A配对(表12-5)。
5.64组密码子中,有三组不编码任何氨基酸,而是多肽合成的终止密码子(termination codon)
反密码子
密码子
A
U
C
G
G
U
C
I
U
C
A
U
G
A
终止密码子为UAG、UAA、UGA。另外一组密码子AUG既是甲硫氨酸的密码子,又是肽链合成的起始密码子(initiation codon)。
6.密码近于完全通用
所谓密码的通用性是指各种高等和低等的生物(包括病毒、细菌及真核生物等)在多大程度上可共用同一套密码。较早时,曾认为密码是完全通用的。让兔网织红血球的核糖体与大肠杆菌的氨酰-tRNA及其他蛋白质合成因子一起进行反应时,合成的是血红蛋白,说明大肠杆菌tRNA上的反密码子可以正确阅读血红蛋白mRNA上的信息。这样的交叉试验也在豚鼠和南非爪蛙等其他生物中进行过,都证明了密码的通用性。
但是最近的一些发现对密码的通用性提出了质疑。线粒体DNA中的编码情形显然违背了遗传密码的通用性。如人线粒体中UGA不再是终止密码子,而编码色氨酸。表12-6列出了人线粒体基因组编码的特点。
酵母线粒体、原生动物纤毛虫也有类似情形。所以结论应该是:遗传密码并非是绝对通用的,而是近于完全通用的。
密码子
通常情况下可编码的
线粒体DNA所编码的
UGA
UGG
AUA
AUG
AGA
AGG
终止信号色氨酸异亮氨酸甲硫氨酸精氨酸精氨酸
色氨酸色氨酸甲硫氨酸甲硫氨酸终止信号终止信号
蛋白质合成的分子基础
氨基酸是在核糖体上加入到多肽链中的。在与mRNA作用之前,氨基酸先共价地与转运RNA(transfer RNA,tRNA)形成氨酰-tRNA。氨酰-tRNA结合到mRNA的特殊位点上。mRNA含有遗传密码的信息,用于指导特定氨基酸序列多肽链的合成。一个核糖体结合到一个mRNA分子合成起始序列上,并由此开始读码,沿着密码序列合成一条多肽链。读码的方向是从mRNA的5′到3′,而合成出来的多肽则是从氨基端到羧基端。通常,一个mRNA分子上可结合有多个不同时间开始翻译的核糖体,这样的结构称为多聚核糖体(polysome)。在原核细胞中,mRNA的转录与多肽的翻译是同时进行的,如图12-1所示,可见在染色体DNA分子上,有多条正在转录的mRNA分子,每个分子上都结合有多个正在进行翻译的核糖体。真核生物的转录与翻译是在不同的地方进行的,核糖体可以自由地存在于细胞质中,或者与内质网膜结合。RNA分子在蛋白质的合成中起着举足轻重的作用,除了mRNA和tRNA,核糖体还含有核糖体RNA(ribosome RNA,rRNA)。
一、mRNA是蛋白质合成的模板
Jacob F.和Monod J.早在1961年就已提出mRNA的概念。他们认为,既然蛋白质是在细胞质中合成的,而编码蛋白质的信息载体DNA却在细胞核内,所以必定有一种中间物质用来传递DNA上的信息。他们研究大肠杆菌中与乳糖代谢有关酶类的生物合成时发现诱导物,如异丙基硫代半乳糖苷(β-isopropylthiogalactoside)的加入,可以立刻使酶蛋白的合成速度增加上千倍。而诱导物一旦消失,又可使酶蛋白的合成立刻停止。这个实验结果给人的启示是:蛋白质合成的模板是一种不稳定的物质,其半寿期很短。他们对这种信使物质的性质作了如下的预言:
①信使是一种多核苷酸。
②信使的碱基组成应与相应的DNA的碱基组成相一致。
③信使的长度应是不同的,因为由它们所编码的多肽链的长度是不同的。
④在多肽合成时信使应与核糖体作短暂的结合。
图12-1 大肠杆菌中mRNA的转录与多肽的翻译是同时进行的
A为多聚核糖体的电镜照片
⑤信使的半寿期很短,所以信使的合成速度应该是很快的。
所以,这样的信使可能是一种RNA。但是当时已发现的两种RNA都不具备这些特性。各种生物的rRNA的大小差异不大,碱基组成的变化也不大。tRNA除了有与rRNA相同的问题以外,它们的分子也太小,所以这两种RNA都不能胜任信使的功能。可喜的是当时已有人提出过,认为细胞中有可能存在第三种RNA。被噬菌体T2感染后的大肠杆菌中,有人发现有一种新的RNA,它的代谢速度极快,分子的大小也参差不齐,碱基组成又与T2DNA相一致。这些特性都符合信使分子的要求。
mRNA的概念提出后,还必须要用实验来证明这种概念是否正确。Brenner S.,Jacob F.和Monod M.等人设计了一组实验:用噬菌体T2感染大肠杆菌后,发现几乎所有在细胞内合成的蛋白质都不再是细胞本身的蛋白质,而是噬菌体所编码的蛋白质,这些蛋白质的合成速度与细胞总RNA的合成速度无关;T2感染后不久,细胞中出现了少量半寿期很短的RNA,它们的碱基组成与T2DNA是一致的。上述这些特性都与他们预言的信使分子特性十分符合。他们将大肠杆菌接种在含有重标记(15N和12C)的培养基上,再用T2感染。感染后立刻将细菌转移到含有轻同位素(14N和12C)的培养基上。再将T2感染前与感染后的细菌破碎,分离出核糖体,用密度梯度超离心技术将带有重同位素的核糖体与带有轻同位素的核糖体分开。他们还用32P或用14C尿苷去标记RNA,并用35S-甲硫氨酸去标记新合成的蛋白质。这些实验结果(图12-2)表明:
①T2感染后并无轻标记核糖体出现,说明在T2感染后并未引起新核糖体的合成。
②T2感染后,诱发了新的RNA的合成。大多数放射性标记的RNA出现在重标记核糖体中。这种新合成的RNA代谢速度极快。
③35S标记的蛋白质只暂时出现在重标记核糖体中,说明新合成的蛋白质是在早就存在的核糖体中合成的。
以后,Spiegelman又用分子杂交技术证明了经T2感染后的新合成的RNA可以与T2DNA杂交,但细胞内的其他RNA则不能与T2DNA杂交,从而证明新合成的RNA是由T2噬菌体DNA编码的。
对于mRNA的结构特征,我们已经有了较详尽的了解。mRNA以核苷酸序列的方式携带遗传信息,通过这些信息来指导合成多肽链中的氨基酸的序列。每一个氨基酸可通过mRNA上3个核苷酸序列组成的遗传密码来决定,这些密码以连续的方式连接,组成读码框架(reading frame)。读码框架之外的序列称作非编码区,这些区域通常与遗传信息的表达调控有关。在读码框架的5′端,是由起始密码(start codon)AUG开始的,它编码一个蛋氨酸。在读码框架的3′端,含有一个或一个以上的终止密码(stop codon):UAA、UAG和UGA,其功能是终止这一多肽链的合成。在真核生物mRNA的3′端,通常还含有转录后加上去的多聚腺嘌呤核苷酸(polyA)序列作尾巴,其功能可能与增加mRNA分子的稳定性有关。
mRNA分子的5′端序列对于起始密码的选择有重要作用,这种作用对于原核生物和真核生物还有所差别。原核生物中(图12-3),在mRNA分子起始密码子的上游含有一段特殊的核糖体结合位点(ribosome-binding site)序列,这一结合位点使得核糖体能够识别正确的起始密码AUG。原核生物的mRNA通常是多基因的,分子内的核糖体结合位点使得多个基因可独立地进行读码框架的翻译,得到不同的蛋白质。而对于真核生物而言,其mRNA通常只为一条多肽链编码,核糖体与mRNA 5′端的核糖体进入部位(ribosome entry site)结合之后,通过一种扫描机制向3′端移动来寻找起始密码,mRNA 5′末端的帽子结构可能对于核糖体进入部位的识别起着一定作用。翻译的起始通常开始于从核糖体进入部位向下游扫描到的第一个AUG序列。
图12-3 真核生物及原核生物mRNA结构简图
二、tRNA转运活化的氨基酸至mRNA模板上
tRNA含有两个关键的部位:一个是氨基酸结合部位,另一个是与mRNA的结合部位。对于组成蛋白质的20种氨基酸来说,每一种至少有一种tRNA来负责转运。为了准确地翻译,每一种tRNA必需能被很好地识别。在书写时,将所运氨基酸写在tRNA的右上角,如tRNAPhe及tRNASer分别表示苯丙氨酸和丝氨酸转运的tRNA。大多数氨基酸具有几种用来转运的tRNA,一个细胞中,通常含有50或更多的不同的tRNA分子。
tRNAPhe是第一个通过X射线晶体衍射技术测定了tRNA分子的空间结构,其他tRNA都与它类似,可用一个如图12-4的结构来表征其一级、二级、三级结构。所有的tRNA都是有由50-95?(70-90)个核苷酸组成的一条多聚核苷酸链,这条链经过折叠,呈现三叶草型结构,含有4个双链的茎和4个单链的环。5′端和3′端的碱基通过形成7个Waston-Crick碱基配对将两端拉到一起,形成受体端,氨基酸通过与3′端的核糖连接而形成氨酰-tRNA分子。tRNA的3′端通常是CCA的序列。
未配对的环的命名由其特定的结构来定。环I的大小在7~11个核苷酸之间,常含有稀有碱基dihydrouracil,故命名为D环;环Ⅱ含有被称作反密码子(anticodon)的3个碱基序列,被命名为反密码子环。tRNA的这一部分在蛋白质的合成中非常重要,它可与mRNA模板上的密码子进行碱基配对的专一性的识别,并将所携带的氨基酸送入到合成的多肽链的指定位置上;环Ⅲ是可变环,其组成可在3~21个碱基之间,是tRNA大小变化最大的区域;环Ⅳ含有稀有的胸腺嘧啶核糖核苷(ribothymidine)和假尿嘧啶核苷(pseudouridine)(符号ψ表示)碱基作为不变序列,故把它叫做TψC环。
tRNA三叶草型的二级结构可折叠成L-型的三维结构,如图12-4所示,这一结构由两个螺旋以直角的方位构成,结合氨基酸的一端称接受臂(acceptor arm),另一端则含有反密码子,被称作反密码子臂(anticodon arm)。tRNA分子上与多肽合成有关的位点至少有4个,分别为3′端CCA上的氨基酸接受位点、识别氨酰-tRNA合成酶的位点、核糖体识别位点及反密码子位点。
图12-4 tRNA的结构简图
tRNA在识别mRNA分子上的密码子时,具有接头(adaptor)的作用。氨基酸一旦与tRNA形成氨酰-tRNA后,进一步的去向就由tRNA来决定了。tRNA凭借自身的反密码子与mRNA分子上的密码子相识别(图12-5),而把所带的氨基酸送到肽链的一定位置上。Chapeville及Lipmann(1962)做了一个巧妙的实验来证明这一点。将放射性同位素标记的半胱氨酸在半胱氨酰-tRNA合成酶催化下与tRNACys形成半胱氨酰-tRNACys,然后用活性镍作催化剂,使半胱氨酸转变成丙氨酸,形成丙氨酰-tRNACys。然后将它放到网织红细胞无细胞体系中进行蛋白质合成。分析后,发现丙氨酸插入了本应由半胱氨酸所占的位置。
前面在讨论遗传密码的性质时曾提到过密码的简并性问题。这里将进一步讨论与此有关的tRNA分子突变与校正基因(suppressor gene)的问题。遗传学家早就发现了回复突变(reverse mutation)现象。回复突变的原因很多,其中有一种回复突变是由于其在基因上发生的一个突变引起的,这称为基因间校正突变。长期以来人们很难解释基因间校正突变。但是现在由于对tRNA的结构功能有了较深入的了解,基因间校正突变的本质已经被揭露了。大多数校正突变是发生在tRNA基因的突变上,从而使tRNA的反密码子在阅读mRNA的信息时发生了变化。下面举一个例子加以说明(图12-6)
从图12-6可以看出,某基因中部发生点突变而出现了一个额外的终止密码子UAG,于是多肽的合成在中途终止,产物失去生物活性,所以这种突变称为无义突变(nonsense mutation),因为基因产物变得没有什么生物学意义了。对酪氨酸专一的tRNA上的反密码子应为3′—AUG—5′,但如果此tRNA的基因发生突变,使反密码子变成3′—AUC—5′,它就可以将mRNA上的终止信号UAG读成酪氨酸了,从而使多肽的合成得以继续。所合成的多肽中只有在酪氨酸处发生突变,这样的多肽突变体常具有部分或全部活力。通常,当有某种tRNA突变分子出现时,也必定有可以识别正常氨基酸的tRNA存在。例如,tRNATyr的突变分子可识别终止信号,但同时也必定有可以正常识别UAC,UAU酪氨酸密码子的tRNATyr分子存在。这样,就可使翻译维持正常。
三、核糖体是蛋白质合成的工厂
早在1950年就有人将放射性同位素标记的氨基酸注射到小鼠体内,经短时间后,取出肝脏,制成匀浆,离心,分成核、线粒体、微粒体及上清等组分。发现微粒体中的放射性强度最高。再用去污剂,如脱氧胆酸,处理微粒体,将核糖体从内质网中分离出来,发现核糖体的放射性强度比微粒体的要高7倍。这就说明核糖体是合成蛋白质的部位。
核糖体是一个巨大的核糖核蛋白体。在原核细胞中,它可以以游离形式存在,也可以与mRNA结合形成串状的多核糖体。平均每个细胞约有2 000个核糖体。真核细胞中的核糖体既可以以游离状态存在,也可以与细胞内质网相结合形成粗面内质网。每个真核细胞所含核糖体的数目要多得多,为106~107个。线粒体、叶绿体及细胞核内也有自己的核糖体。表12-7中总结了不同生物核糖体的一些组成特性。
表12-7 核糖体的结构组成
核糖体种类
亚基
rRNA(相对分子质量)
蛋白质分子数目
原核细胞核糖体
(以大肠杆菌为例)
30 S
↗
70 S
↘
50 S
16 S (5.5×105)
5 S (0.4×105)
23 S ((110×105)
21
34
真核细胞核糖体
40 S
↗
80S
↘
60 S
18 S (~70×105)
5 S (0.4×105)
28~29 S (140~180×105)
~30
~50
核糖体由两个亚基构成,一个较大,一个较小。当镁离子浓度为10mmol/L时,大、小亚基聚合,镁离子浓度下降至0.1 mmol/L时,又解聚。原核细胞核糖体的30S亚基含有21种蛋白质,还含有一分子16SrRNA。50S亚基中含34种蛋白及5S,23SrRNA各一分子。真核细胞核糖体的40S亚基中有30多种蛋白质及一分子18S rRNA。60S亚基中有50多种蛋白质及5S,28SrRNA各一分子。哺乳类核糖体的60S大亚基中还有一分子5.8S rRNA。
核糖体RNA(rRNA)
核糖体内的所有rRNA在形成核糖体的结构和功能上都起重要作用。rRNA中有很多双螺旋区。图12-7为16S rRNA的二级结构。
16S rRNA在识别mRNA上的多肽合成起始位点中起重要作用。但对rRNA的其他生物学功能还缺少了解。
5S、16S、23S三种rRNA的基因是连在一起的。所以,最初的30S转录产物即rRNA的前体中含有这三种rRNA。30SrRNA前体经过RNaseⅢ的切割形成16S前体rRNA及23S前体rRNA。这些rRNA前体的进一步加工是在与核糖体蛋白相结合后进行的。
图12-7 16S rRNA的二级结构核糖体蛋白
应用双向聚丙烯酰胺凝胶电泳等技术,已成功地将大肠杆菌的核糖体蛋白质进行了分离。大多数蛋白呈纤维状,只有极少数是呈球形的。
核糖体的结构模型
应用电镜及其他物理学方法,已经提出了大肠杆菌30S,50S及70S核糖体的结构模型(图12-8)。70S核糖体为一椭圆球体(13.5 nm×20.0 nm×40.0nm),30S亚基之外形好像一个动物的胚胎,长轴上有一凹下去的颈部,将30S亚基分成头部与躯干两部分。50S亚基之外形很特别,好像一把特殊的椅子,三边带有突起,中间凹下去的部位有一个很大的空穴。当30S与50S亚基互相结合成70S核糖体时,30S亚基水平地与50S亚基相结合,腹面与50S亚基之空穴相抱,它的头部与50S亚基中含蛋白质较多的一侧相结合。两亚基接合面上留有相当大的空隙。蛋白质生物合成可能就在这空隙中进行。
图12-8 原核生物核糖体的功能位点核糖体的大小亚基与mRNA有不同的结合特性。大肠杆菌的30S亚基能单独与mRNA结合形成30S核糖体-mRNA复合体,后者又可与tRNA专一地结合,50S亚基不能单独地与mRNA结合,但可非专一地与tRNA相结合,50S亚基上有两个tRNA位点:A、氨酰基位点(A位点)与肽酰基位点(P位点)。这两个位点的位置可能是在50S亚基与30S亚基相结合的表面上。50S亚基上还有一个在肽酰-tRNA移位过程中使GTP水解的位点。B、在50S与30S亚基的接触面上有一个结合mRNA的位点。此外,C、核糖体上还有许多与起始因子、延伸因子、释放因子及与各种酶相结合的位点。至此,不难看出核糖体是一个多么复杂的结构,它真配得上称为蛋白质合成的工厂。
采用温和的条件小心地从细胞中分离核糖体时可以得到3~4个成串的甚至上百个成串的核糖体,称为多核糖体(polyribosome)。多核糖体是由一个mRNA分子与一定数目的单个核糖体结合而成念珠状。两个核糖体之间有一段裸露的mRNA。每个核糖体可以独立完成一条肽链的合成(见图12-1)。所以在多核糖体上可以同时进行好多条多肽链的合成。这样就提高了翻译的效率。
翻译的步骤
肽链合成是向氨基端(N端)还是向羧基端(C端)延伸的呢?Dintzis等人用3H-亮氨酸作标记分析了兔网织红细胞无细胞体系中血红蛋白生物合成的过程。血红蛋白中含有较多亮氨酸。其氨基酸序列为已知。合成反应在较低温度(15℃)中进行,以降低合成速度。在反应开始后的4~60min内,每隔一定时间取样分析。将带有标记的蛋白质分离出来,用胰蛋白酶水解肽链,用纸层析分离水解碎片并测定所含的放射性强度。实验结果如图12-9所示。从图中可以看出,反应4min后,只有羧基端含有3H-亮氨酸。随着反应时间的延长,带有标记的肽段自羧基端向氨基端延伸,到60min时,几乎整个肽段都布满了标记物。这个实验说明多肽链的合成是从N端向C端进行的。肽链延长的速度极快。兔网织红细胞的一个核糖体合成一条完整的血红蛋白α链(146个氨基酸残基),在37℃时约需3 min。大肠杆菌具有更高的速度,一个核糖体每秒钟可延伸20个氨基酸。
现已经证明,mRNA上信息的阅读(翻译)是从mRNA的5′端向3′端进行的。这方面的实验很多,只举一例。当用下列人工合成的多核苷酸作模板:
5′—pAAA—(AAA)n—AAC—OH—3′
在无细胞体系中进行翻译时,其多肽产物为:
赖氨酰—(赖氨酰)n—天冬酰胺而且,天冬酰胺以羧基为末端,所以它的密码子AAC是最后才被翻译的。这就证明了翻译的方向为5′→3′。由于mRNA从DNA模板的转录作用也是由5′→3′进行的,因此在细胞内当mRNA的转录还没有完成时,翻译工作就可以开始了。
蛋白质合成是最复杂的生物化学过程之一,它包括了上百种不同的蛋白质,以及30多种RNA分子的参与。这一过程开始于氨基酸接在特异的tRNA上,随后的步骤则在核糖体上进行。氨基酸通过tRNA转运到核糖体上,直到氨基酸掺入到多肽链中后tRNA才离开核糖体。
一、氨酰-tRNA合成酶帮助使氨基酸结合到特定的tRNA上(氨基酸的活化)
一种称为氨酰-tRNA合成酶的酶类参与了将氨基酸结合到其对应的tRNA上的过程。这种结合有两方面的意义:①氨基酸与tRNA分子的结合使得氨基酸本身被活化,利于下一步进行的肽键形成反应;②tRNA可以携带氨基酸到mRNA的指定部位,使得氨基酸能够被掺入到多肽链合适的位置。这样,氨酰-tRNA合成酶不仅为蛋白质的合成解决了能量问题,而且还解决了专一性问题。
氨酰-tRNA合成酶参与的合成分两步进行:第一步是氨酰-tRNA合成酶识别它所催化的氨基酸以及另一底物ATP,在氨酰-tRNA合成酶的催化下,氨基酸的羧基与AMP上的磷酸之间形成一个酯键,同时释放出一分子PPi:
氨基酸+ATP→氨酰-AMP+Ppi
这个反应的平衡常数大约为1,以至于ATP分子中磷酸酐键断裂所具备的能量继续保存到了氨酰-AMP分子中。这时,氨酰-AMP仍然紧密地与酶分子结合。
第二个氨酰-tRNA合成酶催化的反应是通过形成酯键将氨基酸连接到tRNA 3′端的核糖上:
氨酰-AMP+tRNA→氨酰-tRNA+AMP
氨酰-tRNA合成酶之间在识别tRNA的部位上有所不同。一些氨酰-tRNA合成酶能特异形成
2′形式的酯,有的形成3′形式的酯,有的还可能形成混合物。一旦结合到最末端的核糖上后,氨酰基团还能在2′或3′的羟基之间进行交换,但只有3′形式的酯才参与在核糖体催化下的下面的转肽反应。
上面两个由氨酰-tRNA合成酶催化的反应可总结如下式:
氨基酸+ATP+tRNA → 氨酰-tRNA+AMP+PPi
最后的这个总反应的平衡常数近于1,自由能降低极少,反应是可逆的。但随着PPi被焦磷酸酶水解成两个自由磷酸分子,上述反应就趋向于完全。氨基酸与核糖之间形成的高能酯键对于蛋白质合成中肽键的形成十分重要。
1、每一个氨酰-tRNA合成酶可识别一个特定的氨基酸和与此氨基酸对应的tRNA的特定部位
对应于20种氨基酸的每一种氨基酸,大多数细胞都只含有一种与之对应的氨酰-tRNA合成酶,每一种氨酰-tRNA合成酶既能够识别相应的氨基酸,又能识别与此氨基酸相对应的一个或多个tRNA分子。有时,还把氨酰-tRNA合成酶和与之对应的tRNA分子叫做“遗传密码第二”。
通过对氨酰-tRNA合成酶识别tRNA反密码子的专一性的分析,可将它们分成两类:一类可识别反密码子,一类则不能。这一差别可由如下理由来理解。有的tRNA在遗传上其反密码子发生了改变,但其氨酰-tRNA合成酶对它的识别却没有发生改变。与此类似,一些tRNA的反密码子即使被化学方法改变,它们仍能被其相应的氨酰-tRNA合成酶所识别。然而,另一些氨酰-tRNA合成酶则不能识别反密码子发生了变化的tRNA。
tRNA的氨基酸接受臂处于酶活性部位,与ATP结合部位邻近。通过与酶分子的结合,tRNA 3′端的氨基酸接受臂的CCA有较大的构象变化,这种构象变化似乎可使得在末端的AU配对解链,以利于末端碱基与酶分子发生作用。在这一点上看,酶分子对tRNA的识别是特异和复杂的。
2、氨酰-tRNA合成酶能够纠正酰化的错误
许多氨酰-tRNA合成酶似乎含有第二个活性部位,叫做校正部位,用于水解非正确组合的氨基酸和tRNA之间形成的共价联系,这一纠错过程可用异亮氨酰-tRNA合成酶来加以说明。异亮氨酸与缬氨酸只有一个甲基的差异,较难区别。异亮氨酰-tRNA合成酶能够在酰化部位区分这两种氨基酸,然而也会偶尔生成缬氨酰-tRNAIle。当异亮氨酰-tRNA合成酶遇到缬氨酰-tRNAIle时,它的水解活性部位会将其水解掉:
缬氨酰-tRNAIle+H20→缬氨酸+tRNAIle
这样,缬氨酸取代异亮氨酸的错误掺入就可以通过异亮氨酰-tRNA合成酶的水解活性得到避免。经过氨基酰化部位以及校正部位的共同作用,可使翻译过程的错误频率小于万分之一。
二、肽链合成的起始
1、一个特殊的tRNA启动了蛋白质的合成(起始氨基酸及起始tRNA)
所有蛋白质的翻译开始于甲硫氨酸的参与,一个特殊的起始tRNA对所有蛋白质合成中起始氨基酸——甲硫氨酸的掺入负责,这个tRNA可简写为tRNAMet,它也对选择在mRNA上的什么位置开始翻译起重要作用。通常,细胞中只有两种tRNA可携带甲硫氨酸,既原核细胞起始的tRNA为tRNAf,它携带甲酰甲硫氨酸(fMet),另一种携带甲硫氨酸掺入到蛋白质内部的tRNA写作tRNAm,它携带甲硫氨酸(Met)。
在原核细胞中,有一种特异的甲酰化酶,能够使得tRNAMet中的氨基发生甲酰化,这样可使得参与起始的tRNAfMet不参与肽链的延伸过程。这种识别过程在进化过程中逐渐消失,在真核细胞中是不存在的。真核细胞的起始tRNA为tRNA i,起始氨基酸为Met。
2、翻译开始于mRNA与核糖体的结合
蛋白质合成中翻译的开始需要在mRNA分子上选择合适位置的起始密码AUG,这一过程可通过核糖体小亚基与mRNA的结合来完成。原核与真核生物在识别合适的起始密码上有所差别,这种差别源于原核与真核生物mRNA的差异。对于真核生物mRNA而言,它通常只编码一个蛋白质,而原核生物mRNA通常可为多个蛋白质编码(见图12-3)。
在真核生物的mRNA中,最靠近5′端的AUG序列通常是起始密码。核糖体小亚基首先结合在mRNA的5′端,然后向3′端移动,直到AUG序列被tRNAiMet上的反密码子识别。在除酵母以外的高等真核生物中,这种识别为类似GCCGCCpurCCAUGG这样序列所加强,核糖体与它怎样进行的识别过程目前尚不清楚,但可以肯定的是,如没有这样类似的序列,40S小亚基将不能识别AUG,而是继续向3′移动,识别到含有类似序列的AUG时才开始翻译。
在原核细胞中,起始AUG可以在mRNA上的任何位置,并且一个mRNA上可以有多个起始位点,为多个蛋白质编码。原核细胞中的核糖体是如何对mRNA分子内如此众多的AUG起始位点进行识别的?Shine和Dalgarno在20世纪70年代初期解答了这个问题。他们发现,细菌的mRNA通常含有一段富含嘌呤碱基的序列,现被称作SD序列,它们通常在起始AUG序列上游10个碱基左右的位置,能与细菌16S核糖体RNA 3′端的7个嘧啶碱基进行碱基互补性的识别,以帮助从起始AUG处开始翻译,如表12-8所示。这种识别已被证实是细菌中识别起始密码的主要机制,在SD序列上发生增强碱基配对的突变能够加强翻译,反之,发生减弱碱基配对的突变则会减弱翻译的效率。
表12-8 大肠杆菌16S rRNA与SD序列的识别
与SD序列互补的嘧啶碱基富含区
16S rRNA
lacZ mRNA
trpA mRNA
RNA polymerase βmRNA
r-Protein L10 mRNA
3′…HOAUUCCUCCACUA…5′
5′…ACACAGGAAACAGCUAUG…3′
5′…ACGAGGGGAAAUCUGAUG…3′
5′…GAGCUGAGGAACCCUAUG…3′
5′…C CAGGAGCAA AGCUAAUG…3′
SD序列的重要性还可以通过细菌毒素colecin E3的作用机制来说明。这个毒素可通过核酸酶的活性特异地在16S rRNA 3′端切下50个碱基左右的片段,使得核糖体小亚基中的16S rRNA失去了与mRNA上SD序列互补的序列,由此抑制了细菌蛋白质的合成。由于原核生物与真核生物在蛋白质合成起始机制上的差异,colecin E3并不影响真核生物核糖体的功能。
3、蛋白质因子帮助的蛋白质合成起始(蛋白质合成起始复合物的的合成)
在核糖体上的蛋白质合成可分成起始、延长及终止3个不同阶段,每一阶段都涉及到一组不同的蛋白质因子。虽然原核生物与真核生物在蛋白质合成的起始上有差异,但是有三点是大家都要进行的:① 核糖体小亚基结合起始tRNA;② tRNA在mRNA上必需要找到合适的起始密码子;③ 大亚基必须与已经形成复合物的小亚基、起始tRNA、mRNA结合。一些被称作起始因子(initiation factor,IF)的非核糖体蛋白质参与了上述3个过程。这些起始因子不同于核糖体蛋白质,它们仅是临时性地与核糖体发生作用参与蛋白质的起始,之后会从核糖体复合物上解离下来,而核糖体蛋白质则是一直结合在同一核糖体上。
大肠杆菌有3个起始因子(图12-11)与30S小亚基结合。其中IF-3的功能是使前面已结束蛋白质合成的核糖体的30S和50S亚基分开,其他两个起始因子IF-1及IF-2的功能则是促进fMet-tRNAifMet及mRNA与30S小亚基的结合。正如前面已谈到的,mRMA上的SD序列可与小亚基上16S rRNA的3′进行碱基配对,起始密码子AUG可与起始tRNA上的反密码子进行配对。当30S小亚基结合上fMet-tRNAifMet及mRNA形成复合物后,IF-3就解离开来,以便50S大亚基与复合物结合。这一结合使得IF-1及IF-2离开核糖体,同时使结合在IF-2上的GTP发生水解。原核生物的起始过程需要一分子的GTP水解成GDP及磷酸以提供能量。
图12-11 原核生物蛋白质合成起始复合物的形成
图12- 12 真核生物蛋白质合成起始复合物的形成
真核生物蛋白质合成的起始需要更多的蛋白质因子(elF)参与,目前,至少已发现9种,其中有一些因子含有多达11种不同的亚基,我们迄今只知道部分因子的功能。主要的过程如图12-12所示。与原核系统类似,elF-3使得40S小亚基与大亚基分开,而且也是通过GTP的水解使大小亚基结合,然而其间的反应则有所不同。Met-tRNAiMet首先与小亚基结合,同时与elF-2及GTP形成四元复合物,形成的复合物在多个因子的帮助下开始与mRNA的
5′端结合。其中一个因子elF-4含有一个亚基,能够特异性地结合在mRNA的帽子结构上。结合上mRNA后,核糖体小亚基就开始向3′端移动至第一个AUG。这种移动由ATP水解为ADP及磷酸来提供能量。
三、在氨基酸的掺入过程中有3个重复的延伸反应(肽链的延伸)
当起始过程结束后,mRNA上接下来的密码子的翻译则由3个重复的反应来完成一个氨基酸的掺入(入位、形成肽键、移位)。这3个延长反应在原核和真核生物中是相似的,其中两个需要非核糖体蛋白的延长因子(elongation factor,EF)的参与。值得指出的是,肽键的形成并不需要任何蛋白质因子的参与,而是靠核糖体自身催化完成的,这也是蛋白质合成过程中,核糖体参与催化的唯一反应。
图12-13 原核生物蛋白质合成中第二个氨酰-tRNA加入的过程
当与起始密码子紧邻的密码子被氨酰-tRNA上的反密码子识别并结合后,延长反应也就开始了。氨酰-tRNA的结合由氨酰-tRNA结合因子催化,在细菌中简写为EF-Tu,在真核系统中为EF-1。这个因子可与结合有氨酰-tRNA和GTP的核糖体形成四元复合物,同时偶联上GTP的水解。随着氨酰-tRNA与核糖体的结合,EF-Tu则与GDP形成复合物离开核糖体。第二个延长因子EF-Ts则负责催化EF-Tu-GTP复合物的再形成,为结合下一个氨酰-tRNA作准备,以上过程如图12-13所示。EF-1是一个多亚基的蛋白,同时具备了EF-Tu及EF-Ts的性质。
肽键在延长因子从核糖体上解离下来之后马上就形成了,这一过程叫做转肽(transpeptidation),催化这一过程的酶叫肽酰转移酶(peptidyl transferase),它催化的实质是使一个酯键转变成了一个肽键。转肽过程可看作是新加入的氨酰-tRNA上氨基酸的氨基对肽酰-tRNA上酯键的羰基作亲核进攻,如图12-14所示。
嘌呤霉素对蛋白质合成的抑制作用就发生在这一步上。嘌呤霉素的结构与氨酰 -tRNA 3′端上的AMP残基的结构十分相似。肽酰转移酶也能促使氨基酸与嘌呤霉素结合,形成肽酰嘌呤霉素,但其连键不是酯键,而是酰胺键。肽酰-嘌呤霉素复合物很易从核糖体上脱落,从而使蛋白质合成过程中断。这一点不仅证明了嘌呤霉素的作用机制,也说明了活化氨基酸是添加在延伸肽链的羧基上的。
延长过程中的最后一步叫做移位(translocation) (图12-15),如同氨酰-tRNA的结合,这一过程由移位因子催化(原核中为EF-G,真核中为EF-2),此过程有GTP的水解。移位的目的是使核糖体沿mRNA移动.使下一个密码子暴露出来以供继续翻译。
核糖体反应中GTP的作用,
GTP的水解在翻译过程中具有重要的作用,在每掺入一个氨基酸的延长过程中,都有两个GTP分子发生了水解,这相当于整个这一过程消耗的能量的一半。GTP水解过程可通过EF-Tu和EF-G的作用来理解,GTP的结合与水解都在这些因子上进行,这些因子和GTP的复合物与核糖体的作用,才激活了水解部位的活性。随着GTP水解成GDP,这些因子的构象将发生变化,与核糖体分离。GTP及GDP与这些因子的结合与否,成了调节这些因子与核糖体结合的开关。这一过程可通过GTP的类似物GMPPCP来说明。这个类似物在β和γ磷酸基团之间不含氧,而是一个亚甲基,因此难以发生类似GTP生成GDP的过程。在延长反应中,当用GMPPCP取代GTP后,延长反应变慢,这是因为没有GDP的生成延长因子很难与核糖体发生解离。
图12-15 原核生物蛋白质合成中的移位与GTP发生作用的翻译因子属于G蛋白家族,所有的G蛋白都能结合并水解GTP,并且遵从类似的机制,当与GTP结合后,这些蛋白被激活,当结合上水解来的GDP后,就变成无活性的构象。
四、翻译的终止需要释放因子和终止密码子的参加(肽链合成的终止与释放)
翻译的最后一步涉及到合成好的肽酰-tRNA中连接tRNA和C端氨基酸的酯键的切开(图12-16),这一过程除了需要终止密码子外,还需要释放因子(release factors,RFs)的参加。在这一过程中,核糖体与mRNA的解离还需要核糖体释放因子(ribosome releasing factor,RRF)的参与。
细胞通常不含能够识别3个终止密码子的tRNA。在大肠杆菌中,当终止密码子进入核糖体上的A位点后,它们就被释放因子识别。RF-1识别UAA和UAG,RF-2识别UAA和UGA,RF-3不识别终止密码子,但能刺激另外两个因子的活性。当释放因子识别在A位点上的终止密码子后,将改变在大亚基上的肽酰转移酶的专一性,使其能结合水用于亲核进攻,而不是识别通常的底物氨酰-tRNA。换言之,终止反应实际上是将肽酰转移酶活性转变成酯酶活性。图12-17显示在体外实验中,当大肠杆菌的核糖体与fMet-tRNAiMet、RF-1、两个三聚核苷酸AUG和UAA混合后,通过水解,甲酰蛋氨酸得到了生成。
五、核糖体在翻译中能跳跃式读码通常,核糖体对密码子的识别是从起始AUG开始,一个接一个地按顺序进行识别,直到终止密码子,使得翻译严格地按一个读码框架进行。然而,在原核和真核生物中,也有一些例外的情况,翻译中读码框发生了位移(translational frameshifting)。这种位移通常表现为一个碱基位移。但也有核糖体跳过一大段mRNA(如50个碱基)后继续翻译的,这一过程常叫做翻译跳跃(translational jumping)。从遗传信息流方面来看,翻译跳跃类似于mRNA的剪接,只不过遗传信息没有像mRNA的剪接那样被切掉,而是被核糖体忽略掉了。不论是翻译位移还是翻译跳跃,它们都发生在mRNA的特殊位置,这些位置通常会有特殊的序列和结构。虽然人们对特殊的位置和结构已有所掌握,但对核糖体是怎样进行识别的尚不太清楚。
图12-16 原核生物蛋白质合成中新生肽链释放
第四节 蛋白质的运输及翻译后修饰
在核糖体上新合成的多肽被送往细胞的各个部分,以行使各自的生物功能,大肠杆菌新合成的多肽,一部分仍停留在胞浆之中,一部分则被送到质膜、外膜或质膜与外膜之间的空隙,有的也可分泌到胞外。真核细胞中新合成的多肽被送往溶酶体、线粒体、叶绿体胞核等细胞器。所以新合成的多肽的输送是有目的、定向地进行的。尽管蛋白质生物合成中遗传密码只指导20种氨基酸的掺入,然而,对于成熟蛋白质的分析表明,可发现上百种氨基酸的存在,但它们也只是在20种氨基酸基础上衍生出来的。这种翻译后加工过程使得蛋白质组成更加多样化,从而导致蛋白质结构上呈现更大的复杂化。我们关于后加工过程的知识还十分有限。除了对氨基酸残基的侧链基团进行修饰外,还有合成出的部分肽段在蛋白质成熟过程中被切除。这些修饰和加工过程是与这些蛋白质是在什么部位合成的,要运送到什么部位去有关。其实,加工过程在多肽链合成开始即随之进行。在多核糖体上合成的蛋白质或者留在细胞质中,或者运送到细胞器。留在细胞质中的蛋白质从核糖体上释放后即可行使其功能,而运往别处的蛋白质则往往在运送的过程中发生大量的修饰。许多由结合在膜上的多核糖体合成出来的蛋白质或者停留在ER膜上,或者被运往高尔基体、分泌小泡、质膜或溶酶体。
一、蛋白质通过其信号肽引导到目的地
蛋白质的运输尽管比较复杂,但生物系统中的蛋白质的运输可用一个比较简单的模式来解释。每一需要运输的多肽都含有一段氨基酸序列,称为信号肽序列(signal or leader sequence),引导多肽至不同的转运系统。在真核细胞中,当某一种多肽的N端刚开始合成不久,这种多肽合成后的去向就已被决定。一部分核糖体以游离状态停留在胞浆中,它们只合成供装配线粒体及叶绿体膜的蛋白质。另一部分核糖体受新合成的多肽的N端上的信号肽(signal sequence)所控制而进入内质网,使原来表面平滑的内质网(smooth ER)变成有局部凸起的粗面内质网(rough ER)。与内质网相结合的核糖体可合成三类主要的蛋白质:溶酶体蛋白,分泌到胞外的蛋白和构成质膜骨架的蛋白。信号肽的概念首先是由Salatini D.和Blobel G.所提出的。以后,Milstein C.和Brownlee G.在体外合成的免疫球蛋白肽链的N端找到了这种信号肽。当时,只是在体外合成的未经加工的免疫球蛋白上找到了信号肽,但不能在体内合成的经过加工的成熟免疫球蛋白上找到它。因为在体内合成后的加工过程中,信号肽被信号肽酶(signal peptidase)切掉了。许多蛋白质激素就是以前体蛋白形式合成的,例如,胰岛素mRNA通过翻译,可得到前胰岛素原蛋白,其前面的23个氨基酸残基的信号肽在转运至高尔基体的过程中被切除。以后在很多真核细胞的分泌蛋白中都发现有信号肽。
信号肽序列通常在被转运多肽链的N端,这些序列在10~40个氨基酸残基范围,氨基端至少含有一个带正电荷的氨基酸,在中部有一段长度为10~15个氨基酸残基的由高度疏水性的氨基酸组成的肽链,常见的为丙氨酸、亮氨酸、缬氨酸、异亮氨酸和苯丙氨酸。这个疏水区极重要,其中某一个氨基酸被非极性氨基酸置换时,信号肽即失去功能。疏水序列表明,一般蛋白质是很难通过脂膜的,而信号肽可引导它至特定的细胞器,并通过膜。什么样的序列能指导蛋白质转运至什么细胞器,目前还没有完全阐明。在信号肽的C端有一个可被信号肽酶识别的位点,此位点上游常有一段疏水性较强的5肽,信号肽酶切点上游的第一个(-1)及第三个(-3)氨基酸常为具有一个小侧链的氨基酸(如丙氨酸)。图12-18为一些真核细胞多肽的信号肽结构。
切点人生长激素 MATGSRTSLLLAFGLLCLPWLQEGSA FPT
人胰岛素原 MALWMRLLPLLALLALWGPDPAAA FVN
牛血清蛋白原 MKWVTFISLLLFSSAYS RGV
小鼠抗体H链 MKVLSLLYLLTAIPHIMS DVQ
鸡溶菌酶 MKSLLILVLCFLPKLAALG KVF
蜂毒蛋白 MKFLVNVALVFMVVYISYIYA APE
果蝇胶蛋白 MKLLVVAVIACMLIGFADPASG CKD
玉米蛋白19 MAAKIFCLIMLLGLSASAATA SIF
酵母转化酶 MLLOAFLFLLAGFAAKISA SMT
人流感病毒A MKAKLLVLLYAFVAG DQI
图12-18 一些真核细胞多肽氨基端的信号肽结构疏水氨基酸残基以粗体字母表示,碱性氨基酸残基用下划线字母表示信号肽的位置也不一定在新生肽的N端,有些蛋白质(如卵清蛋白)的信号肽位于多肽链的中部,但其功能则相同,那么信号肽又是由什么蛋白质加以识别的呢?Blobel等已证明,识别信号肽的是一种核蛋白体,称为信号识别体(signal recognition particle,SRP)。SRP的相对分子质量为325 000,由一分子7SL RNA(长300核苷酸)和6个不同的多肽分子组成。7SL RNA上有两段核苷酸序列,称为Alu序列。Alu序列在哺乳类DNA中颇为常见。SRP有两个功能域,一个用以识别信号肽,另一个用以干扰进入的氨酰-RNA和肽酰移位酶的反应,以终止多肽链的延伸作用。信号肽与SRP之结合发生在蛋白质合成刚一开始时,即N端的新生肽链刚一出现时,一旦SRP与带有新生肽链的核糖体相结合,肽链的延伸作用暂时终止,或延伸速度大大减小。SRP-核糖体复合体就移动到内质网上并与那里的SRP受体停泊蛋白(docking protein)相结合。一旦与此受体相结合后,蛋白质合成的延伸作用又重新开始。SRP受体是一个二聚体蛋白,由相对分子质量为69 000的α亚基与相对分子质量为30 000的β亚基组成。然后带有新生肽链的核糖体被送入多肽移位装置(translocation machinery)。同时,SRP又被释放到胞浆中,新生肽链又继续延长。移位装置含有两个膜本体蛋白(integral membrane protein):ribophorinⅠ和Ⅱ。
上述整个过程总结于图12-19中。
图12-19 信号肽的识别过程
二、一些线粒体、叶绿体蛋白质是翻译完成后被运输的
线粒体DNA基因组可编码全部线粒体RNA,但只编码一小部分线粒体蛋白。叶绿体的情形也相似。大部分线粒体和叶绿体的蛋白质是由细胞核基因组DNA编码的,并在胞浆内由游离核糖体合成这些蛋白质,再送到这些细胞器中去,这种运输被称作翻译后运输(posttranslational transport)。在这一过程中,为了过膜,这些蛋白质需要通过多肽链结合蛋白(polypeptide chain binding proteins,PCBs)的帮助进行去折叠。往线粒体进行的翻译后运输需要ATP和质子梯度,以帮助蛋白质去折叠和跨膜。
图12-20 细胞色素前体蛋白通过两个信号肽序列的连续跨膜过程由核基因组织编码的线粒体外膜蛋白的N端上也有一段肽链,称为线粒体定向肽,起信号肽的作用。它可以与外膜上的相应位点相识别。线粒体定向肽富含带正电荷的氨基酸和丝氨酸、苏氨酸。
MLKTSSLFTRRUQPSLFRNILRLQST—
(线粒体定向肽)
从胞质往线粒体内运送蛋白质的过程较为复杂,因为线粒体本身具有多膜的结构。如图12-20所示,细胞色素c1前体蛋白的N端有两个信号肽序列。第一个序列被线粒体外膜上的受体蛋白识别,引导至膜上的运输通道并得以进入线粒体内的基质中,这时第一个信号肽被切除。随之,第二个信号肽用与第一个信号肽相似的方式携带多肽穿过内膜,之后第二个信号肽被切除,细胞色素c1则折叠成其天然结构,并结合上一个血红素分子。在胞质中合成的叶绿体蛋白质的运输与线粒体蛋白非常类似,叶绿体新生肽的定向输送也是由N端上的一段肽链决定的,这种肽称为叶绿体转移肽。
三、分泌型的真核蛋白在内质网(endoplasmic reticulum,ER)内合成
在真核细胞中,内质网是最大的模状结构的细胞器,其表面积可以是质膜面积的几倍。大部分的内质网与核糖体相结合形成粗面内质网。在粗面内质网上的核糖体是膜蛋白和分泌性蛋白合成的地方,也是蛋白质分泌途径的起点。多肽经移位后,在内质网的小腔中被修饰。这些修饰作用包括N端信号肽的切除和二硫键形成,使线形多肽呈现一定空间结构及糖基化作用。在内质网的膜及内腔有一些特殊的参与加工分泌蛋白和膜蛋白的蛋白质,如蛋白质二硫键异构酶。通过短时间内在粗面内质网内加工后,分泌蛋白形成被膜包裹的小泡,转运至高尔基体,然后再转运至细胞表面或溶酶体中。
糖基化作用使多肽链转变成糖蛋白。许多膜本体蛋白及抗原蛋白都是糖蛋白。糖蛋白中的糖苷键有两类:一类是肽链上天冬酰胺侧链上的N原子与寡聚糖核之间构成的N-糖苷键;另一类是肽链上丝氨酸、苏氨酸侧链上的氧原子与寡聚糖核之间构成的O-糖苷键。通常在糖蛋白上发现的寡聚糖核(oligosaccharide core)是五聚糖。其成分为3分子甘露糖及2分子N-乙酰胺基葡萄糖。寡聚糖核是如何被带到蛋白质上的呢?已证明携带的载体是长萜醇的磷酸酯(dolichol phosphate)。它是一条具有很长的烃链的磷酸酯,末端的磷酸基可与核糖结合。
四、高尔基体中多肽的糖基化修饰及多肽的分类
高尔基体主要有两方面功能:一是对糖蛋白上的寡聚糖核作进一步修饰与调整;二是将各种多肽进行分类并送往溶酶体、分泌粒(granule)和质膜等目的地。但是何种蛋白质应送往何处是由蛋白质本身的空间结构决定的。
高尔基体是由许多层袋状的膜结构组成的。糖蛋白的进一步糖基化修饰就是在这种膜结构中完成的。以溶酶体中的酶类的输送为例,由于这些酶类自身构象的变化可与6-磷酸甘露糖酯相结合,后者可被高尔基体膜上的受体识别,最终使这些酶-糖蛋白进入溶酶体。所以,6-磷酸甘露糖酯是一种导向标志,指挥糖蛋白的运输方向。但6-磷酸甘露糖酯对分泌蛋白与质膜蛋白并不起导向标志的作用。
五、大肠杆菌蛋白质在翻译的同时也在被运输
细菌中新生肽的定向输送的情形相对于真核细胞来说较为简单,在细胞质中合成出来的多肽可以就在合成部位,或被整合到质膜上,或通过质膜分泌出来行使功能。大多数非细胞质细菌蛋白在核糖体上合成的同时也在被运送至质膜或跨过膜,这一过程称为翻译中运输(cotranslational transport)。这一过程有一组帮助多肽分泌的蛋白质参与,它们中有些是能识别新生肽链N端引导肽序列(1eader sequence)的膜蛋白,可将正在翻译的核糖体拉至质膜,使合成的多肽得到转运。这段引导肽也可被引导肽酶(1eader peptidase)切除,使多肽能够分泌出细胞。