分子生物学基本知识 核酸的结构与功能--核酸的化学组成 核酸的结构与功能 The Structure and Function of Nucleic Acid 1868年,瑞士的内科医生Friedrich Miescher从外科医院包扎伤口的绷带上的脓细胞核中提取到一种富含磷元素的酸性化合物,将其称为核质(nuclein);后来他又从鲭鱼精子中分离出类似的物质,并指出它是由一种碱性蛋白质与一种酸性物质组成的,此酸性物质即是现在所知的核酸(nucleic acid)。1944年Oswald Avery,Colin Macleod和Maclyn McCarty发现,一种有夹膜、具致病性的肺炎球菌中提取的核酸桪NA(deoxyribonucleic acid,脱氧核糖核酸),可使另一种无夹膜,不具致病性的肺炎球菌的遗传性状发生改变,转变为有夹膜,具致病性的肺炎球菌,且转化率与DNA纯度呈正相关,若将DNA预先用DNA酶降解,转化就不发生。该项实验彻底纠正了蛋白质携带遗传信息这一错误认识,确立了核酸是遗传物质的重要地位;DNA遗传作用的进一步肯定来自Alfred Hershey和Martha Chase对一个感染大肠杆菌的病毒的研究。即用放谢性同位素32P标记噬菌体DNA,35S标记其蛋白质外壳,再用标记的噬菌体去感染培养的大肠杆菌,结果发现进入细菌体内,使细菌生长、繁殖发生变化的是32P标记的DNA,而不是35S标记的蛋白质,并且新繁殖生成的噬菌体不含35S,只含32P。1953年Watson和Crick创立的DNA双螺旋结构模型,不仅阐明了DNA分子的结构特征,而且提出了DNA作为执行生物遗传功能的分子,从亲代到子代的DNA复制(replication)过程中,遗传信息的传递方式及高度保真性,为遗传学进入分子水平奠定了基础,成为现代分子生物学发展史上最为辉煌的里程碑。后来的研究又发现了另一类核酸桼NA(ribonucleic acid,核糖核酸),RNA在遗传信息的传递中起着重要的作用。从此,核酸研究的进展日新月异,如今,由核酸研究而产生的分子生物学及其基因工程技术已渗透到医药学、农业、化工等领域的各个学科,人类对生命本质的认识进入了一个崭新的天地。 核酸的化学组成 核酸是生物体内的高分子化合物,包括DNA和RNA两大类。 一、元素组成 组成核酸的元素有C、H、O、N、P等,与蛋白质比较,其组成上有两个特点:一是核酸一般不含元素S,二是核酸中P元素的含量较多并且恒定,约占9~10%。因此,核酸定量测定的经典方法,是以测定P含量来代表核酸量。 二、化学组成与基本单位 核酸经水解可得到很多核苷酸,因此核苷酸是核酸的基本单位。核酸就是由很多单核苷酸聚合形成的多聚核苷酸。核苷酸可被水解产生核苷和磷酸,核苷还可再进一步水解,产生戊糖和含氮碱基(图1)。 图1 核酸的组成 核苷酸中的碱基均为含氮杂环化合物,它们分别属于嘌呤衍生物和嘧啶衍生物。核苷酸中的嘌呤碱(purine)主要是鸟嘌呤(guanine,G)和腺嘌呤(adenine,A),嘧啶碱(pyrimidine)主要是胞嘧啶(cytosine,C)、尿嘧啶(uracil,U)和胸腺嘧啶(thymine,T)。DNA和RNA都含有鸟嘌呤(G)、腺嘌呤(A)和胞嘧啶(C);胸腺嘧啶(T)一般而言只存在于DNA中,不存在于RNA中;而尿嘧啶(U)只存在于RNA中,不存在于DNA中。它们的化学结构请参见图示。  核酸中五种碱基中的酮基和氨基,均位于碱基环中氮原子的邻位,可以发生酮式一烯醇式或氨基亚氨基之间的结构互变。这种互变异构在基因的突变和生物的进化中具有重要作用。  有些核酸中还含有修饰碱基(modified component),(或稀有碱基,unusual com ponent),这些碱基大多是在上述嘌呤或嘧啶碱的不同部位甲基化(methylation)或进行其它的化学修饰而形成的衍生物。一般这些碱基在核酸中的含量稀少,在各种类型核酸中的分布也不均一。DNA中的修饰碱基主要见于噬菌体DNA,如5-甲基胞嘧啶(m5C),5-羟甲基胞嘧啶hm5C;RNA中以tRNA含修饰碱基最多,如1-甲基腺嘌呤(m1A),2,2一二甲基鸟嘌呤(m22G)和5,6-二氢尿嘧啶(DHU)等。  嘌呤和嘧啶环中含有共轭双键,对260nm左右波长的紫外光有较强的吸收。碱基的这一特性常被用来对碱基、核苷、核苷酸和核酸进行定性和定量分析。 核酸中的戊糖有核糖(ribose)和脱氧核糖(deoxyribose)两种,分别存在于核糖核苷酸和脱氧核糖核苷酸中。为了与碱基标号相区别,通常将戊糖的C原子编号都加上“′”,如C1′表示糖的第一位碳原子。 戊糖与嘧啶或嘌呤碱以糖苷键连接就称为核苷,通常是戊糖的C1′与嘧啶碱的N1或嘌呤碱的N9相连接。 核苷中戊糖的羟基与磷酸以磷酸酯键连接而成为核苷酸。生物体内的核苷酸大多数是核糖或脱氧核糖的C5′上羟基被磷酸酯化,形成5′核苷酸。核苷酸在5′进一步磷酸化即生成二磷酸核苷和三磷酸核苷。以核糖腺苷酸为例,除AMP外,还有二磷酸腺苷(ADP,adenosine 5′-diphosphate)和三磷酸腺苷(ATP,adenosine 5′-triphosphate)两种形式。核苷酸的二磷酸酯和三磷酸酯多为核苷酸有关代谢的中间产物或者酶活性和代谢的调节物质,以及作为核苷酸有关代谢的中间产物或者酶活性和代谢的调节物质,以及作为生理储能和供能的重要形式。 核苷酸还有环化的形式。它们主要是3′,5′-环化腺苷酸(cAMP,adenosine 3′,5′-cyclicmonophosphate)和3′,5′-环化鸟苷酸(cGMP,guanosine 3′,5′-cyclic monophosphate),化学结构如下。环化核苷酸在细胞内代谢的调节和跨细胞膜信号中起着十分重要的作用。  表1 核苷酸及相应的核苷、碱基名称中英文对照表 核苷酸 核苷 碱基  腺苷酸(AMP) 腺苷 腺嘌呤(A)  adenosine monophosphate adenosine adenine  脱氧腺苷酸(dAMP) 脱氧腺苷    deoxydenosine monophosphate deoxyadenosine    鸟苷酸(GMP) 鸟苷 鸟嘌呤(G)  guanosine monophosphate guanosine guanine  脱氧鸟苷酸(dGMP) 脱氧鸟苷    deoxyguanosine monophosphate deoxyguanosine    胞苷酸(CMP) 胞苷 胞嘧啶(C)  cytidine monophosphate cytidine cytosine  胞氧胞苷酸(dCMP) 脱氧胞苷    deoxycytidine monophosphate deoxycytidine    胸苷酸(TMP/dTMP) 胸苷 胸腺嘧啶(T)  thymidine monophate thymidine thymine  尿苷酸(UMP) 尿苷 尿嘧啶(U)  uridine monophosphate uridine uracil  DNA的一级结构与功能 (一)DNA的一级结构 核酸是由很多单核苷酸聚合形成的多聚核苷酸(polynucleotide),DNA的一级结构即是指四种核苷酸(dAMP、dCMP、dGMP、dTMP)按照一定的排列顺序,通过磷酸二酯键连接形成的多核苷酸,由于核苷酸之间的差异仅仅是碱基的不同,故又可称为碱基顺序。核苷酸之间的连接方式是:一个核苷酸的5′位磷酸与下一位核苷酸的3′-OH形成3′,5′磷酸二酯键,构成不分支的线性大分子,其中磷酸基和戊糖基构成DNA链的骨架,可变部分是碱基排列顺序。核酸是有方向性的分子,即核苷酸的戊糖基的5′位不再与其它核苷酸相连的5′末端,以及核苷酸的戊糖基3′位不再连有其它核苷酸的3′末端,两个末端并不相同,生物学特性也有差异。 寡核苷酸(oligonucleotide)是指二至十个甚至更多个核苷酸残基以磷酸二酯键连接而成的线性多核苷酸片段。目前多由仪器自动合成而用作DNA合成的引物(Primer)、基因探针(probe)等,在现代分子生物学研究中具有广泛的用途。 表示一个核酸分子结构的方法由繁至简有许多种(图1)。由于核酸分子结构除了两端和碱基排列顺序不同外,其它的均相同。因此,在核酸分子结构的简式表示方法中,仅须注明一个核酸分子的哪一端是5′末端,哪一端是3′末端,末端有无磷酸基,以及核酸分子中的碱基顺序即可。如未特别注明5′和3′末端,一般约定,碱基序列的书写是由左向右书写,左侧是5′末端,右侧为3′末端。  图1 核酸分子结构的表示方式 (二)基因组DNA 自然界绝大多数生物体的遗传信息贮存在DNA的核苷酸排列顺序中。DNA是巨大的生物高分子,一般将细胞内遗传信息的携带者棗染色体所包含的DNA总体称为基因组(genome)。同一物种的基因组DNA含量总是恒定的,不同物种间基因组大小和复杂程度则差异极大,一般讲,进化程度越高的生物体其基因组构成越大、越复杂,见(表1)。 表1 某些有代表性的生物体内DNA大小     分子量 碱基对(bp) 千碱基对(kb)  最简单的微生物 SV40病毒 3×106 5×103 5    λ噬菌体 3.4×107 5×104 50  细菌 大肠杆菌 2.2×109 4.6×106 4600  哺乳动物 小鼠 1.5×1012 2.3×109 230万    人 1.8×1012 2.8×109 280万  DNA分子中不同排列顺序的DNA区段构成特定的功能单位,即基因(gene)。基因的功能取决于DNA的一级结构。一个DNA分子能携带多少基因呢?如果以1000~1500bp编码一个基因计算,猿猴病毒SV40基因组DNA有5000碱基对(base pair,bp),可编码5种基因,人类基因组含3×109bp DNA,理论上可编码200万以上的基因,然而,由于哺乳动物的基因含有内含子(intron),因而每个基因可长达5000~8000bp,少数可达20,000bp。按这样大小的基因进行推算,人类基因组相当于40~60万个基因。这可能吗?虽然现在还不知道确切数字,但利用核酸杂交已测得哺乳类细胞含50,000~100,000种mRNA,由此推论整个基因组所含基因不会超过10万个,只占全部基因组的6%,另外5~10%为rRNA等重复基因,其余80~90%属于非编码区,没有直接的遗传学功能。DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间,可能在DNA复制、调控中具有重要意义,并与生物进化、种族特异性有关。可见原核细胞由于DNA分子较小,必须充分利用有限的核苷酸序列,这是真核基因组与原核基因组显然不同之处。 真核基因组与原核基因组在结构上还有很多不同的特点,归纳如下: 1.真核生物基因组结构特点 ①真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。 ②真核细胞基因转录产物为单顺反子(monocistron),即一个结构基因转录、翻译成一个mRNA分子,一条多肽链。 ③存在大量重复序列,即在整个DNA中有许多重复出现的核苷酸顺序,重复序列长度可长可短,短的仅含两个核苷酸,长的多达数百、乃至上千。重复频率也不尽相同;高度重复序列重复频率可达106次,包括卫星DNA、反向重复序列和较复杂的重复单位组成的重复序列;中度重复序列可达103~104次,如为数众多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些编码区序列如rRNA基因、tRNA基因、组蛋白基因等;单拷贝或低度重复序列,指在整个基因组中只出现一次或很少几次的核苷酸序列,主要是编码蛋白质的结构基因,在人基因组中占约60~65%,因此所含信息量最大。 ④基因组中不编码的区域多于编码区域。 ⑤基因是不连续的,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序列(intervening sequences),称为内含子(intron),编码区则称为外显子(exon)。内含子与外显子相间排列,转录时一起被转录下来,然后RNA中的内含子被切掉,外显子连接在一起成为成熟的mRNA,作为指导蛋白质合成的模板。 ⑥基因组远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。 2.原核生物基因组结构特点 ①基因组较小,没有核膜包裹,且形式多样,如病毒基因组可能是DNA,也可能是RNA,可能是单链的,也可能是双链的,可能是闭环分子,也可能是线性分子;细菌染色体基因组则常为环状双链DNA分子,并与其中央的RNA和支架蛋白构成一致密的区域,称为类核(nucleoid)。 ②功能相关的结构基因常常串连在一起,并转录在同一个mRNA分子中,称为多顺反子mRNA(polycistronic mRNA),然后再加工成各种蛋白质的模板mRNA。 ③DNA分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基因表达的顺序。例如,噬菌体ψX 174中只有5%是非编码区。 ④基因重叠是病毒基因组的结构特点,即同一段DNA片段能够编码两种甚至三种蛋白质分子。 ⑤除真核细胞病毒外,基因是连续的,即不含内含子序列。 (三)限制性片段长度多态性 随着对基因认识的不断深入,发现在同种生物的不同个体之间,尽管其蛋白质产物的结构和功能完全相同或仅存在着细微的差异,但在DNA水平却存在着差异,尤其在不编码蛋白质的区域以及没有重要调节功能的区域表现更为突出。这种不影响生物体表型的DNA突变被称为中性突变。 分子生物学技术的不断发展已使得从DNA水平直接分析这类突变成为可能。 目前应用较多且成熟的方法是限制性片段长度多态性(Restriction fragment length polymorphism,RFLP)。即当DNA序列中某一个碱基发生突变,使突变所在部位的DNA序列获得或丢失某种限制性核酸内切酶位点;或当DNA分子内部发生较大的顺序突变如缺失、重复、插入,或DNA高变区内某串联重复顺序的拷贝数不同致使其两侧限制性核酸内切酶位点发生相对位移时,利用相应的限制性核酸内切酶消化此DNA,便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中就会出现不同长度的限制性片段类型。 因为DNA的中性突变常以孟德尔显性遗传方式遗传给下一代,所以对这类突变检测已广泛用于遗传病的诊断、产前诊断、亲子鉴定以及法医学上对罪犯的确认等。 (四)DNA序列分析(DNA sequencing) DNA的一级结构决定了基因的功能,欲想解释基因的生物学含义,首先必须知道其DNA顺序。因此DNA序列分析是分子遗传学中一项既重要又基本的课题。 1986年由美国学者提出的,目前正在实施的人类基因组计划(human genome project),则是要通过对人类基因组3×109bp全序列的序列分析和人类基因的染色体图谱制定达到了解其结构,认识其功能,即从分子遗传学水平来认识人类自身的结构和功能特征的目的。 核酸的核苷酸序列测定方法已经过近20年的发展,因而测序的具体方法五花八门、种类繁多。但是究其所依据的基本原理,不外乎Sanger的核酸链合成终止法及Maxam和Gilbert的化学降解法两大类。虽然原理不同,但这两种方法都同样生成互相独立的若干组带放射性标记的寡核苷酸,每组寡核苷酸都有固定的起点,但却随机终止于特定的一种或多种残基上。由于DNA链上每一个碱基出现在可变终止端的机会均等,因而上述每一组产物都是一些寡核苷酸的混合物,这些寡核苷酸的长度由某一种特定碱基在原DNA片段上的位置所决定。然后在可以区分长度仅相差一个核苷酸的不同DNA分子的条件下,对各组寡核苷酸进行电泳分析,只要把几组寡核苷酸加样于测序凝胶中若干个相邻的泳道之上,即可从凝胶的放射自显影片上直接读出DNA上的核苷酸顺序。以下分别介绍。 1.Sanger双脱氧链终止法 DNA的合成总是从5′端向3′端进行的。DNA的合成需要模板以及相应的引导核酸链。DNA的合成过程中,在合成的DNA链的3′末端,依据碱基配对的原则,通过生成新的3′,5′-磷酸二酯键,使DNA链合成终止,产生短的DNA链。具体测序工作中,平行进行四组反应,每组反应均使用相同的模板,相同的引物以及四种脱氧核苷酸;并在四组反应中各加入适量的四种之一的双脱氧核苷酸,使其随机地接入DNA链中,使链合成终止,产生相应的四组具有特定长度的、不同长短的DNA链。这四组DNA链再经过聚丙烯酸胺凝胶电泳按链的长短分离开,经过放射自显影显示区带,就可以直接读出被测DNA的核苷酸序列(图2)。  图2 双脱氧链终止法测定DNA序列原理示意 2.MaxamGilbert DNA化学降解法 这一方法的基本步骤为(1)先将DNA的末端之一进行标记(通常为放射性同位素32P;(2)在多组互相独立的化学反应中分别进行特定碱基的化学修饰;(3)在修饰碱基位置化学法断开DNA链;(4)聚丙烯酰胺凝胶电泳将DNA链按长短分开;(5)根据放射自显影显示区带,直接读出DNA的核苷酸序列(图3)。  图3 化学裂解法测定DNA的核苷酸序列 DNA的二级结构与功能 (一)DNA的二级结构双螺旋结构模型(double helix model) 1953年,Watson和Crick提出了著名的DNA分子的双螺旋结构模型,揭示了遗传信息是如何储存在DNA分子中,以及遗传性状何以在世代间得以保持。这是生物学发展的重大里程碑。 在DNA双螺旋结构模型建立之前,早在1868年,Miescher已经从脓细胞提取到核酸与蛋白质的复合物,当时称为核素(nuclein)。但核酸在生命活动中的重要地位,却迟至本世纪50年代才被认识。 本世纪20年代,Levene研究了核酸的化学结构并提出四核苷酸假说;40年代末,Avery,Hershey和Chase的实验严密地证实了DNA就是遗传物质;50年代初,Chargaff应用紫外分光光度法结合纸层析等简单技术,对多种生物DNA作碱基定量分析,发现DNA碱基组成有如下规律(表1)。 表1 不同生物来源的DNA四种碱基比例关系 DNA来源 腺嘌呤(A) 胸腺嘧啶(T) 鸟嘌呤(G) 胞嘧啶(C) (A+T)/(G+C)  大肠杆菌 25.4 24.8 24.1 25.7 1.01  小麦 26.8 28.0 23.2 22.7 1.21  鼠 29.7 25.6 21.9 22.8 1.21  猪:肝 29.4 29.7 20.5 20.5 1.43  胸腺 30.0 28.9 20.4 20.7   脾 29.6 29.2 20.4 20.8   酵母 31.3 32.9 18.7 17.5 1.079  (1)同一生物的不同组织的DNA碱基组成相同; (2)一种生物DNA碱基组成不随生物体的年龄、营养状态或者环境变化而改变; (3)几乎所有的DNA,无论种属来源如何,其腺嘌呤摩尔含量与胸腺嘧啶摩尔含量相同(A]=[T),鸟嘌呤摩尔含量与胞嘧啶摩尔含量相同(G]=[C),总的嘌呤摩尔含量与总的嘧啶摩尔含量相同([A+G]=[C]+[T)。 (4)不同生物来源的DNA碱基组成不同,表现在A+T/G+C比值的不同; 这些结果后来为DNA的双螺旋结构模型提供了一个有力的佐证。 Watson和Crick以立体化学原理为准则,对Wilkins和Franklin的DNA X射线衍射分析结果加以研究,提出了DNA结构的双螺旋模式,其主要内容如下:  图1 DNA的双螺旋结构模式 A.正面观:长方框内有详细说明,S代表脱氧核糖。 B.俯视:涂黑的是碱基,此处全部碱基都是嘧啶,只看到糖的侧面略呈三角形,最外围是磷酸及其酯键。 (1)在DNA分子中,两股DNA链围绕一假想的共同轴心形成一右手螺旋结构,双螺旋的螺距为3.4nm,直径为2.0nm。(图1,A,B)。 (2)链的骨架(backbone)由交替出现的、亲水的脱氧核糖基和磷酸基构成,位于双螺旋的外侧。 (3)碱基位于双螺旋的内侧,两股链中的嘌呤和嘧啶碱基以其疏水的、近于平面的环形结构彼此密切相近,平面与双螺旋的长轴相垂直。一股链中的嘌呤碱基与另一股链中位于同一平面的嘧啶碱基之间以氢链相连,称为碱基互补配对或碱基配对(base pairing),碱基对层间的距离为0.34nm。碱基互补配对总是出现于腺嘌呤与胸腺嘧啶之间(A=T),形成两个氢键;或者出现于鸟嘌呤与胞嘧啶之间(G=C),形成三个氢键。(图2)。  图2 A-T,G-C间的氢键形成 (4)DNA双螺旋中的两股链走向是反平行的,一股链是5′→3′走向,另一股链是3′→5′走向。两股链之间在空间上形成一条大沟(major groove)和一条小沟(minor groove),这是蛋白质识别DNA的碱基序列,与其发生相互作用的基础。 DNA双螺旋的稳定由互补碱基对之间的氢键和碱基对层间的堆积力(basestacking force)维系。DNA双螺旋中两股链中碱基互补的特点,逻辑地预示了DNA复制过程是先将DNA分子中的两股链分离开,然后以每一股链为模板(亲本),通过碱基互补原则合成相应的互补链(复本),形成两个完全相同的DNA分子。因为复制得到的每对链中只有一条是亲链,即保留了一半亲链,将这种复制方式称为DNA的半保留复制(semiconservative replication)。后来证明,半保留复制是生物体遗传信息传递的最基本方式。 DNA双螺旋是核酸二级结构的重要形式。双螺旋结构理论支配了近代核酸结构功能的研究和发展,是生命科学发展史上的杰出贡献。 (二)DNA结构的多态性 Watson和Crick提出的DNA双螺旋结构属于B型双螺旋,它是以在生理盐溶液中抽出的DNA纤维在92%相对湿度下进行X-射线衍射图谱为依据进行推测的,这是DNA分子在水性环境和生理条件下最稳定的结构。然而以后的研究表明DNA的结构是动态的。在以钾或绝作反离子,相对湿度为75%时,DNA分子的X-射线衍射图给出的是A构象,A-DNA每螺旋含11个碱基对,而且变成A-DNA后,大沟变窄、变深,小沟变宽、变浅。由于大沟、小沟是DNA行使功能时蛋白质的识别位点,所以由B-DNA变为A-DNA后,蛋白质对DNA分子的识别也发生了相应变化。 一般说来,A-T丰富的DNA片段常呈B-DNA。采用乙醇沉淀法纯化DNA时,整个过程中,大部分DNA由B-DNA经过C-DNA,最终变构为A-DNA。若DNA双链中一条链被相应的RNA链所替换,会变构成A-DNA。当DNA处于转录状态时,DNA模板链与由它转录所得的RNA链间形成的双链就是A-DNA。由此可见A-DNA构象对基因表达有重要意义。此外,B-DNA双链都被RNA链所取代而得到由两条RNA链组成的双螺旋结构也是A-DNA。除A-DNA、B-DNA螺旋外,还存在B′-DNA、C-DNA、D-DNA等,其结构参数见表2。 表2 不同右手双螺旋DNA的结构参数 双螺旋 碱基倾 碱基夹 碱基间距 螺距 每轮碱 小沟宽/nm× 大沟宽nm×    角/(°) 角(°) /nm /nm 基数 小沟宽nm 大沟宽nm  B-DNA 0 36.0 0.337 3.4 10 0.57×0.75 1.17×0.85  C-DNA 6 38.0 0.331 3.1 9.3 0.48×0.79 1.05×0.75  D-DNA   45.0 0.303     0.13×0.67 0.89×0.58  A-DAN 20 32.7 0.256 2.8 11 1.10×0.28 0.27×1.35  总之,DNA的双螺旋结构永远处于动态平衡中,DNA分子构象的变化与糖基和碱基之间空间相对位置有关。 1979年,Wang和Rich等人在研究人工合成的CGCGCG单晶的X-射线衍射图谱时出人意料地发现这种六聚体的构象与上面讲到的完全不同。它是左手双螺旋,与右手螺旋的不同是螺距延长(4.5nm左右),直径变窄(1.8nm),每个螺旋含12个碱基对,分子长链中磷原子不是平滑延伸而是锯齿形排列,有如“之”字形一样,因此叫它Z构象(英文字Zigzag的第一个字母)。还有,这一构象中的重复单位是二核苷酸而不是单核苷酸;而且ZDNA只有一个螺旋沟,它相当于B构象中的小沟,它狭而深,大沟则不复存在(图3)。进一步的分析还证明,Z-DNA的形成是DNA单链上出现嘌呤与嘧啶交替排列所成的。比如CGCGCGCG或者CACACACA。  图3 Z-DNA和B-DNA Z-DNA有什么生物学意义呢?应当指出Z-DNA的形成通常在热力学上是不利的。因为Z-DNA中带负电荷的磷酸根距离太近了,这会产生静电排斥。但是,DNA链的局部不稳定区的存在就成为潜在的解链位点。DNA解螺旋却是DNA复制和转录等过程中必要的环节,因此认为这一结构与基因调节有关。比如SV40增强子区中就有此结构,又如鼠类微小病毒DNS复制区起始点附近有GC交替排列序列。此外,DNA螺旋上沟的特征在其信息表达过程中起关键作用。调控蛋白都是通过其分子上特定的氨基酸侧链与DNA双螺旋沟中的碱基对一侧的氢原子供体或受体相互作用,形成氢键从而识别DNA上的遗传信息的。大沟所带的遗传信息比小沟多。沟的宽窄和深浅也直接影响到调控蛋白质对DNA信息的识别。ZDNA中大沟消失,小沟狭而深,使调控蛋白识别方式也发生变化。这些都暗示ZDNA的存在不仅仅是由于DNA中出现嘌呤一啶嘧交替排列之结果,也一定是在漫漫的进化长河中对DNA序列与结构不断调整与筛选的结果,有其内在而深刻的含意,只是人们还未充分认识而已。 DNA构象的可变性,或者说DNA二级结构的多态性的发现拓宽了人们的视野。原来,生物体中最为稳定的遗传物质也可以采用不同的姿态来实现其丰富多采的生物学功能。 多年来,DNA结构的研究手段主要是X射线衍射技术,其结果是通过间接观测多个DNA分子有关结构参数的平均值而获得的。同时,这项技术的样品分析条件使被测DNA分子与天然状态相差甚远。因此,在反映DNA结构真实性方面这种方法存在着缺陷。1989年,应用扫描隧道显微镜(scanning tummeling microscopy,STM)研究DNA结构克服了上述技术的缺陷。这种先进的显微技术,不仅可将被测物放大500万倍,且能直接观测接近天然条件下单个DNA分子的结构细节。STM技术的应用是DNA结构研究中的重要进展,可望在探索DNA结构的某些未知点上展示巨大潜力。 (三)DNA结构的不均一性(heterogeneity) 在DNA的一级结构中,四种碱基A,T,C,G远非均匀分布,尽管双螺旋的构型大体相同,但沿着DNA链各处的物理结构不完全相同,各处双螺旋的稳定性也就显示出差别,充分体现了DNA一级结构决定高级结构的原理。其不均一性主要有: 1.反向重复序列(inverted repeats) 又称回文序列(palindrome),它能在DNA或RNA中形成发夹结构。这种回文结构通常是作为一种特别信号,如限制性核酸内切酸(restriction encl闩迥onuclease)及调节蛋白的识别位点,转录终止信号等。 2.富含A/T的序列 在高等生物中,A+T与G+C的含量差不多相等,然而在它们的染色体某一区域,A·T含量可能相当高。如在很多有重要调节功能的DNA区段都富含A·T,特别是在复制起点和启动子的Pribnow框(真核生物为TATA框)的序列中,其对于复制和起始十分重要。因为A-T对只有二条氢键,此处的双链较G-C对处易于解开,有利于起始复合物的形成。 3.嘌呤和嘧啶的排列顺序对双螺旋结构稳定性的影响。 人们考察了十种相邻的二核苷酸对(nearestneighbor doublets),发现一个非常有趣的现象,那就是碱基组成相同,但嘌呤和嘧啶的排列顺序不同,双螺旋的稳定性具有显著的差异。例如5′GC 3′ 3′G 5′和5′GC 3′ 3′GC 5′的稳定性相差很大,前者的稳定性远大于后。它们的氢键数目是相同的,它们的差别在于相邻碱基之间的堆集力不同。即从嘌呤到嘧啶的方向的碱基堆集作用显著地大于同样组成的嘧啶到嘌呤方向的碱基堆集作用。(这里的方向就是常规的从5′端到3′端的方向)。这是因为前者的嘌呤环和嘧啶环重迭面积大于后者的嘧啶环和嘌呤环的重迭面积,这在B型DNA中确是如此。 根据Gotoh 1981年的研究,十种相邻二核苷酸对的Tm值如表3所示,单位为℃,所用离子强度为19.5mmol/L Na+。 表3 相邻二核苷酸对Tm值   3′   A T G C  5′ A 54.50 57.02 58.42 97.73   T 36.73 54.50 54.71 86.44   G 86.44 97.73 85.97 136.12   C 54.71 58.42 72.55 85.97  由表15-5可以看到,5′TA 3′ 3′AT5′的Tm值最低。在真核生物中,常可以在19到27的位置上看到一个叫做TATA框的结构(又称Hogness框),这是RNA聚合酶的结合位点。在这里RNA聚合酶和有关蛋白质因子形成转录起始复合物。 又如,生命有机体选择UAA作为最有效的终止密码子绝不是偶然的,因为64个三联体密码子中,它与反密码子(假定有的话)形成的互补产物5′UAA3′ 3′AUU5′的Tm值是最低的一个,即使在生理温度下也是不稳定的。当初有人花了很多工夫去寻找一个不携带氨基酸的专供肽链终止用的tRNA,其实并不存在这种tRNA。肽链的释放是由释放因子RF在起作用。在三种终止密码子中,UAG和UGA常会为突变型的tRNA无义抑制,而UAA则很少发生无义抑制也可能就是这个道理。这也就说明了为什么在肽链终止处常常会出现双重终止密码子。 (四)DNA的变性、复性与分子杂交 DNA双螺旋结构模型,不仅与其生物功能有密切关系,还能解释DNA的重要特性棗变性与复性,这对于深入了解DNA分子结构与功能的关系又有重要意义。 1.DNA变性(denaturation) 指DNA分子由稳定的双螺旋结构松解为无规则线性结构的现象。变性时维持双螺旋稳定性的氢键断裂,碱基间的堆积力遭到破坏,但不涉及到其一级结构的改变。凡能破坏双螺旋稳定性的因素,如加热、极端的pH、有机试剂甲醇、乙醇、尿素及甲酰胺等,均可引起核酸分子变性。变性DNA常发生一些理化及生物学性质的改变: 溶液粘度降低。DNA双螺旋是紧密的刚性结构,变性后代之以柔软而松散的无规则单股线性结构,DNA粘度因此而明显下降。 溶液旋光性发生改变。变性后整个DNA分子的对称性及分子局部的构性改变,使DNA溶液的旋光性发生变化。  图4 核酸的解链曲线 增色效应(hyperchromic effect)。指变性后DNA溶液的紫外吸收作用增强的效应。DNA分子中碱基间电子的相互作用使DNA分子具有吸收260nm波长紫外光的特性。在DNA双螺旋结构中碱基藏入内侧,变性时DNA双螺旋解开,于是碱基外露,碱基中电子的相互作用更有利于紫外吸收,故而产生增色效应。 对双链DNA进行加热变性,当温度升高到一定高度时,DNA溶液在260nm处的吸光度突然明显上升至最高值,随后即使温度继续升高,吸光度也不再明显变化。若以温度对DNA溶液的紫外吸光率作图,得到的典型DNA变性曲线呈S型(图4)。可见DNA变性是在一个很窄的温度范围内发生的。通常将核酸加热变性过程中,紫外光吸收值达到最大值的50%时的温度称为核酸的解链温度,由于这一现象和结晶的融解相类似,又称融解温度(Tm,melting temperature)。在Tm时,核酸分子内50%的双螺旋结构被破坏。特定核酸分子的Tm值与其G+C所占总碱基数的百分比成正相关,两者的关系可表示为: Tm=69.3+0.41(%G+C) 一定条件下(相对较短的核酸分子),Tm值大小还与核酸分子的长度有关,核酸分子越长,Tm值越大;另外,溶液的离子强度较低时,Tm值较低,融点范围也较宽,反之亦然,因此DNA制剂不应保存在离子强度过低的溶液中。 2.DNA复性(renaturation) 指变性DNA在适当条件下,二条互补链全部或部分恢复到天然双螺旋结构的现象,它是变性的一种逆转过程。热变性DNA一般经缓慢冷却后即可复性,此过程称之为退火(annealing)。这一术语也用以描述杂交核酸分子的形成(见后)。DNA的复性不仅受温度影响,还受DNA自身特性等其它因素的影响: 温度和时间。一般认为比Tm低25℃左右的温度是复性的最佳条件,越远离此温度,复性速度就越慢。复性时温度下降必须是一缓慢过程,若在超过Tm的温度下迅速冷却至低温(如4℃以下),复性几乎是不可能的,核酸实验中经常以此方式保持DNA的变性(单链)状态。这说明降温时间太短以及温差大均不利于复性。 DNA浓度。溶液中DNA分子越多,相互碰撞结合的机会越大。 DNA顺序的复杂性。简单顺序的DNA分子,如多聚(A)和多聚(U)这二种单链序列复性时,互补碱基的配对较易实现。而顺序复杂的序列要实现互补,则困难得多。在核酸复性研究中,定义了一个Cot的术语,(Co为单链DNA的起始浓度,t是以秒为单位的时间),用以表示复性速度与DNA顺序复杂性的关系。在探讨DNA顺序对复性速度的影响时,将温度、溶剂离子强度、核酸片段大小等其它影响因素均予以固定,以不同程度的核酸分子重缔合部分(在时间t时的复性率)对Cot作图,可以得到如图5所示的曲线。曲线上方为示复杂性的核酸分子的非重复碱基对数。如多聚(A)的复杂性为1,重复的(ATGC)n组成的多聚体的复杂性为4,分子长度是105核苷酸对的非重复DNA的复杂性为105。原核生物基因组均为非重复顺序,故以非重复核苷酸对表示的复杂性直接体现基因组大小(图上方的箭头所指为基因大小),对于真核生物基因组中的非重复片段也是如此。在标准条件下(一般为0.18ml/L阳离子浓度,400核苷酸长的片段)测得的复性率达0.5时的Cot值(称Cot1/2),与核苷酸对的复杂性成正比。对于原核生物核酸分子,此值可代表基因组的大小及基因组中核苷酸对的复杂程度。真核基因组中因含有许多不同程度的重复序列(repetitive sequence),所得到的Cot曲线更为复杂。  图5 不同物种核酸的Cot曲线 DNA的变性和复性原理,现已在医学和生命科学上得到广泛的应用。如核酸杂交与探针技术,聚合酶链反应(polymerase chain reaction,PCR)技术等。 3.分子杂交:(hybridization) 不同来源的核酸变性后,合并在一处进行复性,这时,只要这些核酸分子的核苷酸序列含有可以形成碱基互补配对的片段,复性也会发生于不同来源的核酸链之间,形成所谓的杂化双链(heterodup lex),这个过程称为杂交(hybridization)图6,I)。杂交可以发生于DNA与DNA之间,也可以发生于RNA与RNA之间和DNA与RNA之间。例如,一段天然的DNA和这段DNA的缺失突变体(假定这种突变是DNA分子中部丢失了若干碱基对)一起杂交,电子显微镜下可以看到杂化双链中部鼓起小泡。测量小泡位置和长度,可确定缺失突变发生的部位和缺失的多少。核酸杂交技术是目前研究核酸结构、功能常用手段之一,不仅可用来检验核酸的缺失、插入,还可用来考察不同生物种类在核酸分子中的共同序列和不同序列以确定它们在进化中的关系。其应用当然远不止于确定突变位置这一例(图6Ⅱ)。  图6 核酸杂交及其应用示意图 Ⅰ.变性、复性和杂交。粗细线分别代表不同DNA。A是杂化双链  Ⅱ.突变体的鉴别。B代表天然DNA;C是B的缺失突变体;虚线框内是已缺失的部分; D是显示从天然DNA链鼓出小泡 Ⅲ.粗线代表探针,粗线上的X表示放射性标记 在核酸杂交的基础上发展起来的一种用于研究和诊断的非常有用的技术称探针技术(Probe)。一小段(例如十数个至数百个)核苷酸聚合体的单链,有放射性同位素如32P、35S或生物素标记其末端或全链,就可作为探针。把待测DNA变性并吸附在一种特殊的滤膜,例如硝酸纤维素膜上。然后把滤膜与探针共同培育一段时间,使发生杂交。用缓冲液冲洗膜。由于这种滤膜能较牢固地吸附双链的核酸,单链的在冲洗时洗脱了。带有放射性的探针若能与待测DNA结合成杂化双链,则保留在滤膜上。通过同位素的放射自显影或生物素的化学显色,就可判断探针是否与被测的DNA发生杂交。有杂交现象则说明被测DNA与探针有同源性(homogeneity),即二者的碱基序列是可以互补的。例如:想知道某种病毒是否和某种肿瘤有关,可把病毒的DNA制成探针。从肿瘤组织提取DNA,与探针杂交处理后,有杂化双链的出现,就说明两种DNA之间有同源性。这不等于可以说这种病毒引起肿瘤,但至少这是可以继续深入研究下去的一条重要线索。 探针技术(图6Ⅲ)在遗传性疾病诊断上已开始应用。例如诊断地中海贫血或血红蛋白病,可以由已确诊的病人白细胞中提取DNA,这就是诊断探针。用诊断探针检查,不但可以对有症状患者进行确诊,还可以发现一些没有症状的隐性遗传性疾病。从胎儿的羊水也可以提取到少量DNA。由于探针技术比较灵敏,就使遗传性疾病的产前诊断较为容易办得到了。杂交和探针技术是许多分子生物学技术的基础,在生物学和医学的研究中,以及临床诊断中得到了日益广泛的应用。 DNA的三级结构与功能 (一)DNA超螺旋 双螺旋DNA进一步扭曲盘绕则形成其三级结构,超螺旋是DNA三级结构的主要形式。自从1965年Vinograd等人发现多瘤病毒的环形DNA的超螺旋以来,现已知道绝大多数原核生物都是共价封闭环(covalently closed circle,CCC)分子,这种双螺旋环状分子再度螺旋化成为超螺旋结构(superhelix或supercoil),如图15-11所示。有些单链环形染色体(如φ×174)或双链线形染色体(如噬菌体入),在其生活周期的某一阶段,也必将其染色体变为超螺旋形式。对于真核生物来说,虽然其染色体多为线形分子但其DNA均与蛋白质相结合,两个结合点之间的DNA形成一个突环(loop)结构,类似于CCC分子,同样具有超螺旋形式。超螺旋按其方向分为正超螺旋和负超螺旋两种。真核生物中,DNA与组蛋白八聚体形成核小体结构时,存在着负超螺旋。研究发现,所有的DNA超螺旋都是由DNA拓扑异构酶产生的。  图1 Opencircular(a) and supercoiled (b) forms of PM2 virus DNA,Bar represents 0.2μm.(By courtesy of Dr Lesley Coggins) (二)染色质和核小体 1.染色质 真核生物的染色体(chromasome)在细胞生活周期的大部分时间里都是以染色质(chromatin)的形式存在的。染色质是一种纤维状结构,叫做染色质丝,它是由最基本的单位棗核小体(nucleosome)成串排列而成的。DNA是染色体的主要化学成分,也是遗传信息的载体,约占染色体全部成分的27%,另外组蛋白和非组蛋白占66%,RNA占6%。 组蛋白(histones)是一种碱性蛋白质,等电点一般在PH10.0以上,其特点是富含二种碱性氨基酸(赖氨酸和精氨酸),根据这两种氨基酸在蛋白质分子中的相对比例,将组蛋白分为五种类型(表1)。 表1 五种组蛋白分子的基本参数 种类 类型 碱性氨基酸 酸性 氨基酸 碱性氨基酸/酸性氨基酸 氨基酸 残基数 分子量 核小体 上位置    Lys Arg Lys/Arg       H1 极度富含Lys 29% 1% 29 5% 5.4 215 23 000 连接*  H2A   11% 9% 1.2 15% 1.4 129 14 500 核心  H2B ″ 16% 6% 2.7 13% 1.7 125 13 774 ″  H3 极度富含Lys+富含Arg 10% 13% 0.78 13% 1.8 135 15 324 ″  H4 ″ 11% 14% 0.79 10% 2.5 102 11 282 ″  *现已证明:H1是与核小体的核心颗粒相当靠近的,认为它位于连接DNA上,只是一种习惯说法。 五种组蛋白在同一生物的不同组织中完全一样,在不同的真核生物中也很相似。组蛋白对染色体中DNA的包装有十分重要的作用。 2.核小体  图2A DNA的高级结构 核小体是构成染色质的基本结构单位,使得染色质中DNA、RNA和蛋白质组织成为一种致密的结构形式。核小体由核心颗粒(core particle)和连接区DNA(linker DNA)二部分组成,在电镜下可见其成捻珠状,前者包括组蛋白H2A,H2B,H3和H4各两分子构成的致密八聚体(又称核心组蛋白),以及缠绕其上一又四分之三圈长度为146bp的DNA链;后者包括两相邻核心颗粒间约60bp的连接DNA和位于连接区DNA上的组蛋白H1(图2),连接区使染色质纤维获得弹性。核小体是DNA紧缩的第一阶段,在此基础上,DNA链进一步折叠成每圈六个核小体,直径30nm的纤维状结构,这种30nm纤维再扭曲成襻,许多襻环绕染色体骨架(Scaffold)形成棒状的染色体,最终压缩将近一万倍。这样,才使每个染色体中几厘米长(如人染色体的DNA分子平均长度为4cm)的DNA分子容纳在直径数微米(如人细胞核的直径为6-7μm)的细胞核中。  图2B DNA的高级结构-从核小体至染色体 核小体的形成以及DNA超螺旋结构与功能的关系还不十分清楚,可能与基因的转录调节控制有关。 RNA的结构与功能 DNA是遗传信息的载体,遗传信息的作用通常由蛋白质的功能来实现,但DNA并非蛋白质合成的直接模板,合成蛋白质的模板是RNA。正常细胞遗传信息的流向是:  与DNA相比,RNA种类繁多,分子量相对较小,一般以单股链存在,但可以有局部二级结构,其碱基组成特点是含有尿嘧啶(uridin,U)而不含胸腺嘧啶,碱基配对发生于C和G与U和A之间,RNA碱基组成之间无一定的比例关系,且稀有碱基较多。此外,tRNA还具有明确的三级结构。 表1 RNA的分类   细胞核和胞液 线粒体 功能  核蛋白体RNA rRNA mt tRNA 核蛋白体组成成分  信使RNA mRNA mt mRNA 蛋白质合成模板  转运RNA tRNA mt tRNA 转运氨基酸  不均一核RNA hnRNA   成熟mRNA的前体  小核RNA snRNA   参与hnRNA的剪接、转运  小胞浆RNA scRNA/7SL-RNA   蛋白质内质网定位合成的信号识别体的组成成分  注:原核细胞不含后3种RNA (一)信使RNA(mRNA)与不均一核RNA(hnRNA) 遗传信息从DNA分子抄录到RNA分子中的过程称为转录(transcription)。在真核生物中,最初转录生成的RNA称为不均一核RNA(heterogeneous nuclear RNA,hnRNA),然而在细胞浆中起作用,作为蛋白质的氨基酸序列合成模板的是mRNA(messenger RNA)。hnRNA是mRNA的未成熟前体。两者之间的差别主要有两点:一是hnRNA核苷酸链中的一些片段将不出现于相应的mRNA中,这些片段称为内含子(intron),而那些保留于mRNA中的片段称为外显子(exon)。也就是说,hnRNA在转变为mRNA的过程中经过剪接,被去掉了一些片段,余下的片段被重新连接在一起;二是mRNA的5′末端被加上一个m7pGppp帽子,在mRNA3′末端多了一个多聚腺苷酸(polyA)尾巴。mRNA从5′末端到3′末端的结构依次是5′帽子结构,5′末端非编码区,决定多肽氨基酸序列的编码区,3′末端非编码区,和多聚腺苷酸尾巴。多聚腺苷酸尾一般由数十个至一百几十个腺苷酸连接而成。随着mRNA存在时间的延续,这段聚A尾巴慢慢变短。因此,目前认为这种3′末端结构可能与增加转录活性以及使mRNA趋于相对稳定有关。原核生物的mRNA没有这种首、尾结构。  图1 hnRNA与mRNA的结构比较 (涂斜线者为外显子,空白者为内含子) 1961年,Jacob和Monod首先提出了mRNA的概念。在真核细胞中,由于蛋白质是在胞浆中而不是在核内合成,因此显然要求有一个中间物将DNA上的遗传信息传递至胞浆中。后来的研究证实,这种中间物即信使RNA。mRNA的核苷酸序列与DNA序列相应,决定着合成蛋白质的氨基酸序列。它如何指导氨基酸以正确的顺序连接起来呢?不同的mRNA碱基组成和排列顺序都不同,但都只有A,G,C,U4种碱基。如果一个碱基就可以决定一个氨基酸,则只有四种变化方式,如果两个碱基决定一个氨基酸,则只有16种变化方式,都不能满足20种氨基酸的需要。1961年Crick和Brenner的实验得出了三个核苷酸编码一个氨基酸的结论,并将这种三位一体的核苷酸编码称做遗传密码(genetic code)或三联体密码,这样就可以有64种不同的密码,但此情况下必须假定有一些氨基酸使用两个以上的密码。这一假定很快就被证明是对的。遗传密码具有下列特征: (1)三个核苷酸组成一个密码子,每个密码子由三个前后相联的核苷酸组成,一个密码子只为一种氨基酸编码。共有64个密码子; (2)密码子之间不重叠使用核苷酸,也无核苷酸间隔; (3)一种氨基酸可有多个密码子,这个特点称为密码子的简并性; (4)密码子的通用性,所有生物从最低等的病毒直至人类,蛋白质合成都使用同一套密码子表(表2),仅有极少的例外,如特殊细胞器线粒体,叶绿体所用的密码稍有不同。(表3)。 表2 通用遗传密码及相应的氨基酸 第一个核苷酸5′ 第二个核苷酸 第三个核苷酸3′   U C A G   U 苯丙氨酸 丝氨酸 酪氨酸 半胱氨酸 U   苯丙氨酸 丝氨酸 酪氨酸 半胱氨酸 C   亮氨酸 丝氨酸 终止码 终止码 A   亮氨酸 丝氨酸 终止码 色氨酸 G  C 亮氨酸 脯氨酸 组氨酸 精氨酸 U   亮氨酸 脯氨酸 组氨酸 精氨酸 C   亮氨酸 脯氨酸 谷氨酰胺 精氨酸 A   亮氨酸 脯氨酸 谷氨酰胺 精氨酸 G  A 异亮氨酸 苏氨酸 天冬酰胺 丝氨酸 U   异亮氨酸 苏氨酸 天冬酰胺 丝氨酸 C   异亮氨酸 苏氨酸 赖氨酸 精氨酸 A   蛋氨酸 苏氨酸 赖氨酸 精氨酸 G  G 缬氨酸 丙氨酸 天冬氨酸 甘氨酸 U   缬氨酸 丙氨酸 天冬氨酸 甘氨酸 C   缬氨酸 丙氨酸 谷氨酸 甘氨酸 A   缬氨酸 丙氨酸 谷氨酸 甘氨酸 G  表3 通用遗传密码与线粒体遗传密码之间的一些差异 密码子 通用编码 线粒体编码    哺乳动物 果蝇 酵母菌 植物  UGA 终止码 色氨酸 色氨酸 色氨酸 终止码  AUA 异亮氨酸 蛋氨酸 蛋氨酸 蛋氨酸 异亮氨酸  CUA 亮氨酸 亮氨酸 亮氨酸 苏氨酸 亮氨酸  AGA 精氨酸 终止码 丝氨酸 精氨酸 精氨酸  AGA       注:下标横线者为与通用编码不同的编码 究竟哪一个密码子为哪一种氨基酸编码,即密码子与氨基酸之间的对应关系已在60年代研究解决了。1964年Nirenberg用一种RNA聚合酶体外合成了多聚尿苷酸、多聚腺苷酸等多聚核苷酸,将这些多聚核苷酸分别用于蛋白质的体外合成。发现,当所用的多聚核苷酸为多聚尿苷酸时,只有多聚苯丙氨酸合成,这意味着UUU为苯丙氨酸编码;用其它多聚核苷酸进行相应的实验后发现,CCC为脯氨酸编码,而AAA为赖氨酸编码;其后,有人又用核苷酸比例为已知,但是核苷酸序列随机的多聚核苷酸,以及用已知序列的含两种或两种以上核苷酸的多聚核苷酸进行相应的实验,将结果加以数理统计处理,又解读了一批密码子,其中包括三个终止码,最后,还有一些密码子是通过合成已知序列的三聚核苷酸与核蛋白体和载有放射性同位素标记的氨基酸的tRNA共沉淀原理予以解读的。在所有密码子中,AUG不仅为蛋氨酸编码,而且又是翻译(translation,以mRNA上的遗传信息指导核蛋白体上多肽链合成的过程)的起始信号,UAA、UAG和UGA不为任何氨基酸编码,而是作为翻译的终止信号,统称为终止码(stop codon),又常被叫作无意义码(nonsense codon)。 大多数氨基酸是由一个以上的密码子所编码。这个事实提出了一个问题:编码同一种氨基酸的一组密码子的使用频率是否都相同?细致的分析表明,无论是原核生物,还是高等真核生物,密码子的使用频率并不是平均的,有些密码子的使用率很高,有些则几乎不使用,其使用频率主要与细胞内tRNA含量呈正相关。 (二)转运RNA(tRNA) tRNA(transfer RNA)是蛋白质合成中的接合器分子。tRNA分子有100多种,各可携带一种氨基酸,将其转运到核蛋白体上,供蛋白质合成使用。tRNA是细胞内分子量最小的一类核酸,由70~120核苷酸构成,各种tRNA无论在一级结构上,还是在二、三级结构上均有一些共同特点。tRNA中含有10%~20%的稀有碱基(rare bases),如:甲基化的嘌呤mG、mA,双氢尿嘧啶(DHU)、次黄嘌呤等等。此外,tRNA内还含有一些稀有核苷,如:胸腺嘧啶核糖核苷,假尿嘧啶核苷(Ψ,pseudouridine)等。胸腺嘧啶一般存在于DNA中;在假尿嘧啶核苷中,不是通常嘧啶环中1位氮原子,而是嘧啶环中的5位碳原子与戊糖的1′位碳原子之间形成糖苷键。  tRNA分子内的核苷酸通过碱基互补配对形成多处局部双螺旋结构,未成双螺旋的区带构成所谓的环和襻。现发现的所有tRNA均可呈现图2所示的这种所谓的三叶草样(clover leafpattern)二级结构。在此结构中,从5′末端起的第一个环是DHU环,以含二氢尿嘧啶为特征;第二个环为反密码子环,其环中部的三个碱基可以与mRNA中的三联体密码子形成碱基互补配对,构成所谓的反密码子(anticodon),在蛋白质合成中起解读密码子,把正确的氨基酸引入合成位点的作用;第三个环为TΨ环,以含胸腺核苷和假尿苷为特征;在反密码子环与TΨ环之间,往往存在一个襻,由数个乃至二十余个核苷酸组成,所有tRNA3′末端均有相同的CCA-OH结构,tRNA所转运的氨基酸就连接在此末端上。(图2A)  图2 tRNA的二级与三级结构 A.二级结构(a示反密码环及反密码) B.三级结构(数字示可能的非常见核苷酸对相互作用) 通过X-射线衍射等结构分析方法,发现tRNA的共同三级结构均呈倒L形(图2B),其中3′末端含CCAOH的氨基酸臂位于一端,反密码子环位于另一端,DHU环和TΨ环虽在二级结构上各处一方,但在三级结构上却相互邻近。tRNA三级结构的维系主要是依赖核苷酸之间形成的各种氢键。各种tRNA分子的核苷酸序列和长度相差较大,但其三级结构均相似,提示这种空间结构与tRNA的功能有密切关系。 (三)核蛋白体RNA(rRNA) 核蛋白体RNA(ribosomal RNA)是细胞内含量最多的RNA,约占RNA总量的80%以上,是蛋白质合成机器棗核蛋白体(核糖体)(ribosome)的组成成分。核糖体蛋白(ribosmal protein,rp)有数十种,大多是分子量不大的多肽类,分布在核蛋白体大亚基的蛋白称为rpl,在小亚基的称rps。 原核生物和真核生物的核蛋白体均由易于解聚的大、小亚基组成。对大肠杆菌核蛋白体的研究发现其质量中三分之二是rNRA,三分之一是蛋白质。rRNA分为5S、16S、23S三种。S是大分子物质在超速离心沉降中的一个物理学单位,可反映分子量的大小。小亚基由16SrRNA和21种rps构成,大亚基由5S、23S rRNA和31种 rpl构成。真核生物核蛋白体小业基含18S rRNA和30多种rps,大亚基含28S、5.8S、5S三种rRNA,近50种rpl。各种生物核蛋白体小亚基中的rRNA具有相似的二级结构(图3。  图3 原核生物与真核生物核蛋白体的结构比较 (线粒体核蛋白体的结构与原核相似) 无论在试管内或细胞内,大、小亚基都易于组成核蛋白体整体或分离成两部分。几十种多肽是如何互相联结,又怎样与几种rRNA相连的呢?用提纯了的亚基所有的肽和rRNA在试管内混合,发现不需加入酶或ATP就可以自动组装成为有活性的亚基,但rRNA之间却不能互相替代,也即说这种自我组装过程是以rRNA为主导的。虽然所有多肽在组装中也是缺一不可的,但不同的肽可能有酶的作用或起别构效应。现已证明某些核糖体蛋白具有酶的功能,但基中大多数还未弄清其具体作用。 (四)其它RNA分子 小核RNA(snRNA,small nuclear RNA)存在于真核细胞的细胞核内,是一类称为小核核蛋白体复合体(snRNP)的组成成分,有U1,U2,U4,U5,U6 snRNA等,均为小分子核糖核酸,长约106?89个核苷酸,其功能是在hnRNA成熟转变为mRNA的过程中,参与RNA的剪接,并且在将mRNA从细胞核运到细胞浆的过程中起着十分重要的作用(表4)。 表4 snRNA的种类与功能 snRNA 分子大小(核苷酸数) 功能  U1 165 结合5′-剪接点  U2 185 结合于分支点  U5 116 结合于3′-剪接点  U4 145 106 装配剪接颗粒  U6    小胞浆RNA(scRNA,small cytosol RNA)又称为7SLRNA,长约300个核苷酸,主要存在于细胞浆中,是蛋白质定位合成于粗面内质网上所需的信号识别体(signal recognization particle)的组成成分。 小结 核酸是由核苷酸聚合而成的高分子化合物,是所有生物遗传信息的携带者。根据核苷酸分子中戊糖的类型,将核酸分为脱氧核糖核酸(DNA)和核糖核酸(RNA)两大类。 核苷酸由磷酸基、戊糖和含氮碱基组成,碱基包括嘌呤和嘧啶两大类。DNA一般含A、C、G、T四种碱基,RNA含A、C、G、U四种碱基。 四种核苷酸按照一定的排列顺序,通过3′,5′磷酸二酯键相连形成的线形多核苷酸即DNA的一级结构。不同排列顺序的DNA区段构成的特定功能单位即基因,DNA的一级结构决定了基因的功能。 一般将细胞内染色体包含DNA的总体称为基因组。同一物种的基因组DNA含量总是恒定的,不同物种间基因组大小和复杂程度差异极大。真核生物具有复杂的染色体结构,其基因组DNA上存在着单一序列和大量重复序列,大多数真核基因都是不连续的,在成熟RNA中出现的部分称为外显子,在DNA拼接过程中被删除的部分称为内含子。原核生物没有核膜,其DNA与RNA和蛋白质一起形成一个相对集中的区域即类核。原核生物基因组上功能相关的基因常常串连在一起并转录在同一mRNA分子中,形成多顺反子结构。某些病毒中会出现基因重叠。 在进化过程中DNA可能发生突变,不影响生物体表型的DNA突变称为中性突变,中性突变常以孟德称显性遗传方式遗传给下一代,其中的限制性片段长度多态性已被广泛用于遗传病的诊断、产前诊断、亲子鉴定以及法医学上对罪犯的确认等。 双螺旋结构是DNA的二级结构,由戊糖和磷酸基构成的两条主锭以反平行的方式和右手方向相互缠绕,构成双螺旋的骨架。主链由于其亲水性而处于双螺旋的外表面,碱基由于其一定程度的疏水性而位于双螺旋的内部。两条链上的碱基按A∶T和G∶C的互补规律相互以氢链连接,构成遗传信息可靠传递、DNA半保留复制的基础。两条主链并不充满双螺旋的空间,而在表面形成大沟和小沟。大沟是调控蛋白质识别DNA信息的主要场所。 DNA分子结构并非一成不变,而是在不同条件下可以有所不同,即DNA结构的多态性。在生理状态下DNA主要为B构象,并可能有少量的A构象和Z构象。Z构象是唯一存在的左手双螺旋构象。 DNA链上的四种碱基也非均匀分布,因而产生了一些特异的序列。回文序列是许多限制性核酸内切酶和调控蛋白的识别位点;富含A/T序列则是许多分子遗传学过程所不可缺少的;嘌呤和嘧啶的排列顺序对双螺旋的稳定性也有重大影响。 DNA在热或其他变性剂的作用下,双螺旋结构遭到破坏,双链发生分离,即变性。变性DNA的某些理化性质和生物学性质随之改变,如增色效应。核酸加热变性过程中紫外光吸收值达到最大值的50%时的温度称为核酸的解链温度(Tm),Tm值的大小与核酸分子大小和G+C所占总碱基数的百分比成正相关。变性的DNA单链在适当条件下又能恢复双螺旋结构,即复性作用。不同来源的变性核酸一起复性,则可能发生杂交,杂交是许多分子生物学技术的基础。 双螺旋DNA进一步扭曲而成的超螺旋称为DNA的三级结构。真核生物中,DNA与组蛋白形成核小体结构时,存在着负超螺旋。核小体是构成染色质的基本结构单位,每个核小体单位包括200bp左右的DNA和一个组蛋白八聚体以及一个分子的组蛋白H1。 RNA包括mRNA、hnRNA、rRNA、tRNA、snRNA和scRNA,它们均与遗传信息的表达有关。mRNA是遗传信息的携带者,其核苷酸序列决定着合成蛋白质的氨基酸序列;hnRNA是mRNA的前体,含有转录的、但不出现于成熟mRNA中的核苷酸片段(内含子);tRNA识别密码子,将正确的氨基酸转运至蛋白质合成位点;rRNA是蛋白质合成机器——核蛋白体的组成成分;snRNA在hnRNA向mRNA转变过程的剪接中起十分重要的作用。 DNA的生物合成 (The Biosynthesis of DNA) 脱氧核糖核酸(DNA)是生物界遗传的主要物质基础。生物有机体的遗传特征以密码(code)的形式编码在DNA分子上,表现为特定的核苷酸排列顺序-即遗传信息,在细胞分裂前通过DNA的复制(Replication),将遗传信息由亲代传递给子代,在后代的个体发育过程中,遗传信息自DNA转录(Transcription)给RNA,并指导蛋白质合成,以执行各种生命功能,使后代表现出与亲代相似的遗传性状,这种遗传信息的传递方向,是从DNA到RNA再到蛋白质,即所谓的生物学“中心法则”,80年代以后在某些致癌RNA病毒中发现遗传信息也可存在于RNA分子中,由RNA通过逆转录(reverse transcription)的方式将遗传信息传递给DNA。这为中心法则加入了新的内容。目前认为生物界遗传信息传递的中心法则为:  本章的内容主要涉及DNA生物合成的三个方面,第一,DNA复制,第二,RNA反转录为DNA,第三,细胞内DNA受到损伤时进行的修复作用。 DNA的复制 DNA做为遗传物质的基本特点就是在细胞分裂前进行准确地自我复制(selfreplication),使DNA的量成倍增加,这是细胞分裂的物质基础。1953年Watson和Crick提出DNA双螺旋结构模型指出,DNA是由二条互补的脱氧核苷酸链组成,所以一条DNA链上的核苷酸排列顺序是由图1双螺旋DNA的复制另一条决定的。这就说明DNA的复制是由原来存在的分子为模板来合成新的链。曾经有过多种关于DNA复制方式的学说,包括半保留复制,全保留复制以及分散复制等(图1)。  图1 双螺旋DNA的复制 一、DNA复制的方式及一般过程: (一)DNA的半保留复制(semiconservative replication) Watson和Crick在提出DNA双螺旋结构模型时即推测,DNA在复制时首先两条链之间的氢键断裂两条链分开,然后以每一条链分别做模板各自合成一条新的DNA链,这样新合成的子代DNA分子中一条链来自亲代DNA,另一条链是新合成的,这种复制方式为半保留复制。 1958年Meselson和Stahl利用氮标记技术在大肠杆菌中首次证实了DNA的半保留复制,他们将大肠杆菌放在含有15N标记的NH4Cl培养基中繁殖了15代,使所有的大肠杆菌DNA被15N所标记,可以得到15N桪NA。然后将细菌转移到含有14N标记的NH4Cl培养基中进行培养,在培养不同代数时,收集细菌,裂介细胞,用氯化铯(CsCl)密度梯度离心法观察DNA所处的位置。由于15N桪NA的密度比普通DNA(14N-DNA)的密度大,在氯化铯密度梯度离心(density gradient centrifugation)时,两种密度不同的DNA分布在不同的区带。 实验结果表明:在全部由15N标记的培养基中得到的15N桪NA显示为一条重密度带位于离心管的管底。当转入14N标记的培养基中繁殖后第一代,得到了一条中密度带,这是15N桪NA和14N-DNA的杂交分子。第二代有中密度带及低密度带两个区带,这表明它们分别为15N14N-DNA和14N14N-DNA。随着以后在14N培养基中培养代数的增加,低密度带增强,而中密度带逐渐减弱,离心结束后,从管底到管口,CsCl溶液密度分布从高到低形成密度梯度,不同重量的DNA分子就停留在与其相当的CsCl密度处,在紫外光下可以看到DNA分子形成的区带。为了证实第一代杂交分子确实是一半15N-DNA-半14N-DNA,将这种杂交分子经加热变性,对于变性前后的DNA分别进行CsCl密度梯度离心,结果变性前的杂交分子为一条中密度带,变性后则分为两条区带,即重密度带(15N-DNA)及低密度带(14N-DNA)。它们的实验只有用半保留复制的理论才能得到圆满的解释(图2和16-3)。  图2 DNA的半保留复制第一代分子含有一条亲代的链(用黑色素示),与另一条新合成的链(用白色表示)配对。在以后的连续复制过程中,原来亲代的两条链仍然保持完整,因此总有两个分子各具有一条原来亲代的链  ? 图3 DNA的半保留复制-Meslson Stahl实验密度梯度离心后的DNA 位置:左三管为对照;右三管为实验结果 (二)DNA复制的一般过程: DNA双螺旋是由两条方向相反的单链组成,复制开始时,双链打开,形成一个复制叉(replicative fork,从打开的起点向一个方向形成)或一个复制泡(replicative bubble,从打开的起点向两个方向形成。)两条单链分别做模板。各自合成一条新的DNA链。由于DNA一条链的走向是5′→3′方向,另一条链的走向是3′→5′方向,但生物体内DNA聚合酶只能催化DNA从5′→3′的方向合成。那么,两条方向不同的链怎样才能做模板呢?这个问题由日本学者岗崎先生解决。 原来,在以3′→5′方向的母链为模板时,复制合成出一条5′→3′方向的前导链(leadingstrand),前导链的前进方向与复制叉打开方向是一致的,因此前导链的合成是连续进行的,而另一条母链DNA是5′→3′方向,它作为模板时,复制合成许多条5′→3′方向的短链,叫做随从链(lagging strand),随从链的前进方向是与复制叉的打开方向相反的。随从链只能先以片段的形式合成,这些片段就叫做岗崎片段(Okazaki fragments),原核生物岗崎片段含有1000-2000核苷酸,真核生物一般100?00核苷酸。最后再将多个岗崎片段连接成一条完整的链。由于前导链的合成是连续进行的,而随从链的合成是不连续进行的,所以从总体上看DNA的复制是半不连续复制(图4)。  图4 DNA的半不连续复制 DNA复制的全部过程可以人为地分成三个阶段,第一个阶段为DNA复制的起始阶段,这个阶段包括起始点,复制方向以及引发体的形成,第二阶段为DNA链的延长,包括前导链及随从链的形成和切除RNA引物后填补空缺及连接岗崎片段。第三阶段为DNA复制的终止阶段。在DNA复制的整个过程中需要30多种酶及蛋白质分子参加,我们将在DNA复制的各个阶段中着重介绍它们的作用。 二、DNA复制的起始阶段: (一)DNA复制的起始点 很多实验都证明:复制是从DNA分子上的特定部位开始的,这一部位叫做复制起始点(originof replication)常用ori或o表示。细胞中的DNA复制一经开始就会连续复制下去,直至完成细胞中全部基因组DNA的复制。DNA复制从起始点开始直到终点为止,每个这样的DNA单位称为复制子或复制单元(replicon)。在原核细胞中,每个DNA分子只有一个复制起始点,因而只有一个复制子,而在真核生物中,DNA的复制是从许多起始点同时开始的,所以每个DNA分子上有许多个复制子。 DNA复制起始点有结构上的特殊性,例如:大肠杆菌染色体DNA复制起始点Oric由422个核苷酸组成,是一系列对称排列的反向重复序列,即回文结构(palindrome),其中有9个核苷酸或13个核苷酸组成的保守序列,这些部位是大肠杆菌中DnaA蛋白识别的位置,大肠杆菌染色体DNA是环状双链DNA,它的复制是典型的“θ”型复制(由于形状像希腊字母θ)。从一个起点开始,同时向两个方向进行复制,当两个复制方向相遇时,复制就停止。而有些生物的DNA复制起始区是一段富含A·T的区段。这些特殊的结构对于在DNA复制起始过程中参与的酶和许多蛋白质分子的识别和结合都是必须的。 (二)DNA复制的方向: (1)定点开始双向复制: 这是原核生物和真核生物DNA复制最主要的形式,从一个特定位点解链,沿着两个相反的方向各生长出两条链,形成一个复制泡,用电子显微镜可以观察到复制泡的存在(图5)。  图5 SV40DNA;复制泡生长的电镜图谱 (2)定点开始单向复制: 质粒colE1是个典型的例子,复制从一个起始点开始,以同一方向生长出两条链,形成一个复制叉(replication fork)。 (3)两点开始单向复制: 腺病毒DNA的复制是从两个起点开始的,形成两个复制叉,各以一个单一方向复制出一条新链(图6)。  图6 DNA的半不连续复制和复制泡的形成 总之DNA复制的起点及方向不仅原核细胞与真核细胞不同,就是同属于原核生物和真核生物的不同种属也有相当大的差异(图7)。  图7 DNA链生长方向的三种机制 (三)DNA复制起始引发体的形成及所参与的酶和蛋白质: 1.解链酶(helicase) DNA开始复制时首先在起始点处解开双链,反应是在一种解链酶(helicase)的催化下进行的。解链酶需要ATP分解供给能量。大肠杆菌中DnaB蛋白就有介链酶活性,与随从链的模板DNA结合,沿5′→3′方向移动,还有一种叫做Rep蛋白和前导链的模板DNA结合沿3′→5′方向移动。解链酶的作用就是打开DNA双链之间的氢键。 2.单链结合蛋白:(single strand binding proteins, SSBP) 它与解开的单链DNA结合,使其稳定不会再度螺旋化并且避免核酸内切酶对单链DNA的水解,保证了单链DNA做为模板时的伸展状态,SSBP可以重复利用(图8)。  图8 大肠杆菌DNA复制叉中复制过程简图 3.引发体的形成: DNA复制起始的关健步骤是前导链DNA的合成,一旦前导链DNA的聚合作用开始,随从链DNA的合成也随着开始。由于前导链的合成是连续进行的,所以它的起始相对简单,而随从链的合成是不连续进行的,所以引发阶段比较复杂。大肠杆菌的引发前体由Dna B. Dna C和单链结合蛋白组成。 (1)引物酶(primase) 它是一种特殊的RNA聚合酶,可催化短片段RNA的合成。这种短RNA片段一般十几个至数十个核苷酸不等,它们在DNA复制起始处做为引物。RNA引物的3′桹H末端提供了由DNA聚合酶催化形成DNA分子第一个磷酸二酯键的位置。 (2)引发体(primosome) 高度解链的模板DNA与多种蛋白质因子形成的引发前体促进引物酶结合上来,共同形成引发体,引发体主要在DNA随从链上开始,它连续地与引物酶结合并解离,从而在不同部位引导引物酶催化合成RNA引物,在引物RNA的3′桹H末端接下去合成DNA片段,这就是随从链不连续合成的开始。 三、DNA复制的延长阶段以及参与的酶和蛋白质分子: DNA的复制实际上就是以DNA为模板在DNA聚合酶作用下,将游离的四种脱氧单核苷酸(dATP,dGTP,dCTP,dTTP,简写为dNTP)聚合成DNA的过程。 这是一个非常复杂的酶促反应,需要许多种酶和蛋白质参与,现分别叙述它们在DNA复制中作用。 (一)DNA的聚合反应和DNA聚合酶  图9 DNA聚合酶的作用 1957年,Arthur kornberg首次在大肠杆菌中发现DNA聚合酶Ⅰ,(DNA polymerase Ⅰ,简写DNA polⅠ)后来又相继发现了DNA聚合酶Ⅱ和DNA聚合酶Ⅲ。(DNA polymerase Ⅱ,Ⅲ,简写DNA polⅡ,DNA polⅢ)实验证明大肠杆菌中DNA复制的主要过程靠DNA polⅢ起作用,而DNA polⅠ和DNA polⅡ在DNA错配的校正和修复中起作用。见表1。 这种酶的共同性质是:①需要DNA模板,因此这类酶又称为依赖DNA的DNA聚合酶(DNA dependent DNA polymerase, DDDP)。②需要RNA或DNA做为引物(primer),即DNA聚合酶不能从头催化DNA的起始。③催化dNTP加到引物的3′桹H末端,因而DNA合成的方向是5′→3′。图9。④三种DNA聚合酶都属于多功能酶,它们在DNA复制和修复过程的不同阶段发挥作用。由于DNA聚合酶Ⅰ是研究得最清楚而且代表了其他DNA聚合酶的基本特点,所以我们着重介绍DNA polⅠ的作用并指出另外二种DNA pol的特殊性: 1.DNA聚合酶Ⅰ: DNA polⅠ是由一条多肽链组成,分子量为109KD。酶分子中含有一个Zn++,是聚合活性必须的。 大肠杆菌每个细胞中约有400个酶分子,每个酶分子每分钟在37℃下能催化667个核苷酸参入到DNA链中,用枯草杆菌蛋白酶可将此酶水介成两个片段,大片段分子量为76KD,通常称为klenow片段,小片段为34KD。大小片段具有不同的酶活性。 (1)DNA聚合酶的5′→3′聚合活性: 这是DNA聚合酶最主要的活性,按模板DNA上的核苷酸顺序,将互补的dNTP逐个加到引物RNA3′桹H末端,并促进3′桹H与dNTP的5′桺O4形成磷酸二酯键,酶的专一性表现为新进入的dNTP必须与模板DNA碱基配对时才有催化作用,5′→3′聚合活性存在于klenow片段上(图9和图10)。  图10 DNA聚合酶催化的DNA链延长 (2)DNA聚合酶的3′→5′外切核酸酶活性: 这种酶活性的主要功能是从3′→5′方向识别并切除DNA生长链末端与模板DNA不配对而游离的核苷酸,这种功能称为校对功能,这是保证其聚合作用的正确性不可缺少的,因此对于DNA复制中极高的保真性是至关重要的。 (3)DNA聚合酶的5′→3′外切核酸酶活性: 这种酶活性是从DNA链的5′端向3′末端水解已配对的核苷酸,本质是切断磷酸二酯键,每次能切除10个核苷酸。因此,这种酶活性在DNA损伤的修复中可能起重要作用,对完成的DNA片段去除5′端的RNA引物也是必须的。 DNA polⅠ的5′→3′聚合活性和5′→3′外切酶活性协同作用,可以使DNA一条链上的切口从5′→3′方向移动,这种反应叫做缺刻平移(nick translation),利用此反应可在体外对DNA片段进行放射性磷(α-32PdNTP)的标记制成探针(probe),进行核酸的分子杂交实验,是现代分子生物学的一项重要技术(图11)。  图11 缺刻平移标记DNA探针 许多实验证实DNA polⅠ并不是DNA复制过程中的主要酶,它的作用主要与DNA损伤后的修复有关。 2.DNA聚合酶Ⅱ(DNA polⅡ) 此酶分子量为120KD,每个细胞约有100个酶分子,但活性只有DNA polⅠ的5%,它具有5′→3′聚合活性和3′→5′外切活性,而没有5′→3′外切活性,它的作用可能与DNA损伤修复有关。 3.DNA聚合酶Ⅲ(DNA polⅢ)  图12 DNA聚合酶Ⅲ催化先导链和随从的合成 这是在DNA复制过程中起主要作用的聚合酶,它是由一个多亚基组成的蛋白质分子,其分子量>600kDa整个酶分子形成一个不对称的二聚体,每个大肠杆菌细胞中只有10?0个酶分子,但催化dNTP参入DNA链的速率却是最快的,约为9000核苷酸/每分钟/每个酶分子。这也证明DNA polⅢ是DNA复制过程中主要发挥作用的酶。在大肠杆菌染色体DNA进行复制时,DNA聚合酶Ⅲ全酶并不是单独起作用的,而是与引发体,介链酶等构成一个复制体(replisome)。由于复制体的存在,先导链和随从链可以同时复制。DNA polⅢ是由多亚基组成的不对称二聚体,它可能同时负责先导链和随从链的复制,在φ×174的复制中观察到引发体总是伴随着DNA噜噗(loop)的存在。图16?2可以看到,由于随从链的模板DNA在DNA聚合酶Ⅲ全酶上绕转了180°而形成一个噜噗,因此岗崎片段的合成方向能够与先导链的合成方向以及复制体移动方向保持一致。 随着DNA polⅢ向前移动,先导链的合成逐渐延长的同时,岗崎片段也在不断延长,这一噜噗也在不断扩大。当岗崎片段合成到前一个片段的5′端时,这一大噜噗就释放出来,由于复制叉向前移动又可将另一部分随从链的模板置换出来,由引发体合成新的引物,然后再形成一个小的噜噗,进行新的岗崎片段的合成。由此模型不难看出:随从链的合成需要周期性的引发,因此其合成进度总是与前导链相差一个岗崎片段的长度。岗崎片段完成后,其5′端的RNA引物由DNA polⅠ的5′→3′外切酶活性切除,由此造成的空隙再由DNA polⅠ的5′→3′聚合活性催化dNTP得到填补。所以DNA的复制是在DNA polⅢ和DNA polⅠ互相配合下完成的。 下面列表说明三种大肠杆菌DNA聚合酶的特性 表1 大肠杆菌DNA聚合酶特征 ?? DNA聚合酶Ⅰ DNA聚合酶Ⅱ DNA聚合酶Ⅲ  分子量 109KD 120KD >600KD  每个细胞中的分子数 400 17-100 10-20  5′→3′聚合活性 + + +  37℃转化率核苷酸数/酶分子·分钟 600 30 30,000  5′→3′外切活性 + - -  5′→3′外切活性 + + +  切刻平移活性 + - -  对dNTP亲和力 低 低 高  功能 修复 不详 复制   去除引物 ? ?   填补空缺 ? ?  真核生物DNA聚合酶 真核生物DNA聚合酶有α、β、γ、δ及ε。它们的基本特性相似于大肠杆菌DNA聚合酶,其主要活性是催化dNTP的5′→3′聚合活性,基本特征见表2。 表2 真核生物DNA聚合酶   α β γ δ ε  亚基数 4 4 4 2 5  分子量(KD) >250 36-38 160-300 170 256  细胞内定位 核 核 线粒体 核 核  5′→3′聚合活性 + + + + +  3′→5′外切活性 - - - - -?  功能 复制、引发 修复 复制 复制 复制  真核细胞在DNA复制中起主要作用的是DNA polα,主要负责染色体DNA的复制。DNA polβ的模板特异性是具有缺口的DNA分子,被认为它与DNA修复有关。DNA polγ在线粒体DNA的复制中起作用。DNA polδ不但有5′→3′聚合活性,而且还具有3′→5′外切酶活性,据认为真核生物DNA复制是在DNA polα和DNA polδ协同作用下进行的,前导链的合成靠DNA polδ催化,并且还需要一种细胞周期调节因子椩鲋诚赴丝乖?proliferating cell nucleus antigen, PCNA)参与。而随从链的合成靠DNA polα和引发酶配合作用完成。 (二)与超螺旋松驰有关的酶: DNA复制从起始点开始向一个方向复制时,局部的DNA双链必须打开,主要靠解链酶的作用,打开后的单链还需要单链结合蛋白与其结合,在复制叉向前移动时造成其前方DNA分子所产生的正超螺旋,必须由拓扑异构酶来解决。下面分别介绍它们的作用。 拓扑异构酶(topoisomerase)是一类改变DNA拓扑性质的酶。在体外可催化DNA的各种拓扑异构化反应,而在生物体内它们可能参与了DNA的复制与转录。在DNA复制时,复制叉行进的前方DNA分子部分产生有正超螺旋,拓扑酶可松驰超螺旋,有利于复制叉的前进及DNA的合成。DNA复制完成后,拓扑酶又可将DNA分子引入超螺旋,使DNA缠绕、折叠,压缩以形成染色质。DNA拓扑异构酶有Ⅰ型和Ⅱ型,它们广泛存在于原核生物及真核生物中。表3 表3 大肠杆菌和真核生物中的拓扑异构酶 类型 作用 对超螺旋的作用  Ⅰ型拓扑异构酶  大肠杆菌 切开一股DNA链 松驰负超螺旋  真核生物 切开一股DNA链 松驰正,负超螺旋  Ⅱ型拓扑异构酶  大肠杆菌 切开二股DNA链 构驰正超螺旋;   依赖ATP 引入负超螺旋,     解环连等  真核生物 切开二股DNA链 松驰正超旋,   依赖ATP 但不能引入负超螺旋  拓扑异构酶Ⅰ(TopoⅠ)的主要作用是将环状双链DNA的一条链切开一个口,切口处链的末端绕螺旋轴按照松驰超螺旋的方向转动,然后再将切口封起来。这就使DNA复制叉移动时所引起的前方DNA正超螺旋得到缓解,利于DNA复制叉继续向前打开。拓扑异构酶Ⅰ除上述作用外,对环状单链DNA还有打结或解结作用,对环状双链DNA的环连或解连以及使环状单链DNA形成环状双链DNA都有作用(图13)。  图13 拓扑酶Ⅰ及Ⅱ的作用特点 (a)大肠杆菌拓扑酶Ⅰ催化的4种拓扑异构化作用 (b)拓扑酶Ⅱ的作用 拓扑异构酶Ⅱ(TopoⅡ)是在大肠杆菌中发现的,曾被称为旋转酶(gyrase),它们作用特点是切开环状双链DNA的两条链,分子中的部分经切口穿过而旋转,然后封闭切口,TopoⅡ还可使DNA分子从超螺旋状态转变为松驰状态,此反应不需要ATP参与。DNA复制完成后,TopoⅡ在ATP参与下,DNA分子从松驰状态转变为负超螺旋。此外,TopoⅡ催化的拓扑异构化反应还有环连或解环连,以及打结或解结。 四、DNA复制的终止阶段 DNA在复制过程中,合成出的前导链为一条连续的长链。随从链则是由合成出许多相邻的片段,在连接酶的催化下,连接成为一条长链。连接作用是在连接酶催化下进行的。 连接酶(ligase)的作用是催化相邻的DNA片段以3′、5′-磷酸二酯键相连接。连接反应中的能量来自ATP(或NAD+)。连接酶先与ATP作用,以共价键相连生成E桝MP中间体。中间体即与一个DNA片段的5′-磷酸相连接形成E-AMP-5′-DNA。然后再与另一个DNA片段的3′-OHH末端作用,E和AMP脱下,两个DNA片段以3′、5′磷酸二酯键相连接。随从链的各个DNA片段就是这样连接成一条DNA长链(图14)。  图14 连接酶的催化反应  图15 真核生物DNA复制叉结构示意图 已有研究证明大肠杆菌染色体DNA具有复制终止位点,此处可以结合一种特异的蛋白质分子叫做Tus,这个蛋白质可能是通过阻止解链酶(Helicase)的解链活性而终止复制的。详细的机制还不完全清楚。 DNA复制完成后,靠拓扑酶将DNA分子引入超螺旋结构。 五、真核生物DNA复制的特点: DNA复制的研究最初是在原核生物中进行的,有些原核生物的DNA复制已经搞得很清楚。真核生物比原核生物复杂得多,但DNA复制的基本过程还是相似的。在这里我们主要讨论一些重要的区别。  图16 端粒酶催化端区TG链的合成 1.与原核生物不同,真核生物DNA复制有许多起始点,例如酵母S. cerevisiae的17号染色体约有400个起始点,因此,虽然真核生物DNA复制的速度(60核苷酸/每秒钟)比原核生物DNA复制的速度(E.coli 1700核苷酸/每秒钟)慢得多,但复制完全部基因组DNA也只要几分钟的时间。 2.SV40病毒DNA主要依靠宿主细胞中的DNA复制体系进行DNA的复制,这是了解真核生物DNA复制的体外模型。在真核生物DNA复制叉处,需要两种不同的酶。DNA聚合酶α(polα)和DNA聚合酶δ(polδ)。polα和引物酶紧密结合,在DNA模板上先合成RNA引物,再由polα延长DNA链,这种活性还要复制因子C参与。同时结合在引物模板上的PCNA(增殖细胞核抗原Proliferating cell nuclear antigen)此时释放了polα,然后由polδ结合到生长链3′末端,并与PCNA结合,继续合成前导链。而随从链的合成靠polα紧密与引物酶结合并在复制因子C帮助下,合成岗崎片段(图15)。 3.由于真核生物染色体是线性DNA,它的两端叫做端区(telomeres),端区是由重复的寡核苷酸序列构成的。例如酵母的端区重复序列是5′G(1?)T(3)3′。前面讲到所有生物DNA聚合酶都只能催化DNA从5′→3′的方向合成,因此当复制叉到达线性染色体末端时,前导链可以连续合成到头,而由于随从链是以一种不连续的形式合成岗崎片段,所以不能完成线性染色体末端的复制,如果这个问题不解决,真核生物在细胞分裂时DNA复制将产生5′末端隐缩,使DNA缩短,近十多年的研究表明,真核生物体内都存在一种特殊的反转录酶叫做端粒酶(telomerase),它是由蛋白质和RNA两部分组成的,它以自身的RNA为模板,在随从链模板DNA的3′桹H末端延长DNA,再以这种延长的DNA为模板,继续合成随从链(图16)。 由此可见端粒酶在保证染色体复制的完整性上有重要意义。 反转录作用(reverse?transcription) 1970年Temin等在致癌RNA病毒中发现了一种特殊的DNA聚合酶,该酶以RNA为核板,根据碱基配对原则,按照RNA的核苷酸顺序(其中V与A配对)合成DNA。这一过程与一般遗传信息流转录的方向相反,故称为反转录,催化此过程的DNA聚合酶叫做反转录酶(reverse transcriptase)。后来发现反转录酶不仅普遍存在于RNA病毒中,哺乳动物的胚胎细胞和正在分裂的淋巴细胞中也有反转录酶。 反转录酶的作用是以dNTP为底物,以RNA为模板,tRNA(主要是色氨酸tRNA)为引物,在tRNA3′桹H末端上,按5′→3′方向,合成一条与RNA模板互补的DNA单链,这条DNA单链叫做互补DNA(complementary DNA, cDNA),它与RNA模板形成RNA桪NA杂交体。随后又在反转录酶的作用下,水解掉RNA链,再以cDNA为模板合成第二条DNA链。至此,完成由RNA指导的DNA合成过程(图1)。 图1 反转录酶催化的反转录作用 携带反转录酶的病毒又称为反转录病毒,它侵入宿主细胞后先以病毒RNA为模板靠反转录酶催化合成DNA,随后这种DNA环化并整合到宿主细胞的染色体DNA中去,以原病毒(provirus)的形式在宿主细胞中一代代传递下去。以后又发现许多反转录病毒基因组中都含有癌基因(oncogene),如果由于某种因素激活了癌基因就可使宿主细胞转化为癌细胞。(将在专门一章中叙述)。 大多数反转录酶都具有多种酶活性,主要包括以下几种活性。①DNA聚合酶活性;以RNA为模板,催化dNTP聚合成DNA的过程。此酶需要RNA为引物,多为色氨酸的tRNA,在引物tRNA3′-末端以5′→3′方向合成DNA。反转录酶中不具有3′→5′外切酶活性,因此没有校正功能,所以由反转录酶催化合成的DNA出错率比较高。②RNase H活性;由反转录酶催化合成的cDNA与模板RNA形成的杂交分子,将由RNase H从RNA5′端水解掉RNA分子。③DNA指导的DNA聚合酶活性;以反转录合成的第一条DNA单链为模板,以dNTP为底物,再合成第二条DNA分子。除此之外,有些反转录酶还有DNA内切酶活性,这可能与病毒基因整合到宿主细胞染色体DNA中有关。反转录酶的发现对于遗传工程技术起了很大的推动作用,目前它已成为一种重要的工具酶。用组织细胞提取mRNA并以它为模板,在反转录酶的作用下,合成出互补的DNA(cDNA),由此可构建出cDNA文库(cDNA library),从中筛选特异的目的基因,这是在基因工程技术中最常用的获得目的基因的方法,详见基因工程一章。 小 结 DNA是携带遗传信息的载体,细胞分裂前,通过DNA的复制作用,遗传信息从亲代DNA分子传到子代DNA分子中。DNA复制时,是从一个特定的起始点开始的,两条DNA链分别做模板,在DNA聚合酶等许多酶和蛋白质分子的参与下,以四种脱氧单核苷酸为原料(dNTP),以碱基配对为原则合成新一代的DNA分子,合成方向是5′→3′。经过复制后的DNA分子中,一条链来自亲代DNA分子,另一条链是新合成的,这种复制方式叫做半保留复制。由于DNA分子复制时,两条链分别做模板,有一条链是连续合成的,这条链为前导链,而另一条链合成时只能以5′→3′方向先合成岗崎片段,然后再靠连接酶将这些片段连接起来,形成随从链,所以DNA复制是半不连续的合成。 DNA复制时,先要由DNA拓扑异构酶作用于DNA分子双螺旋,使之松驰,然后才能由解链酶作用,解开双链,此时引物酶合成一段RNA分子做为引物,在DNA聚合酶Ⅲ催化下,连续地合成DNA链。随从链的合成靠多种酶和蛋白质因子参与,在引物酶作用下合成RNA引物,在DNA聚合酶Ⅲ作用下合成DNA片段,它们共同形成了岗崎片段,RNA引物是靠DNA聚合酶Ⅰ的5'→3'外切活性切除的,切除引物后的空隙,再靠DNA聚合酶Ⅰ填补,最后在连接酶作用下,形成长链。 真核生物中DNA的复制靠DNA聚合酶,它有多种不同的形式(α、β、γ、δ等)此外,还有像PCNA等多种蛋白质因子参与。 DNA复制中的准确性很高,因为原核细胞靠DNA聚合酶Ⅰ而真核细胞靠DNA聚合酶δ,都具有3′→5′外切酶活性,可以校正复制中出现的碱基错配。DNA的合成也可以靠反转录酶的催化而完成,这是以RNA分子为模板,合成DNA分子的过程,在致癌的RNA病毒中,有反转录酶的存在,真核生物中的端粒酶就是一种反转录酶,它催化染色体端区DNA的合成。 DNA的损伤与修复 DNA的损伤与修复 DNA存储着生物体赖以生存和繁衍的遗传信息,因此维护DNA分子的完整性对细胞至关重要。外界环境和生物体内部的因素都经常会导致DNA分子的损伤或改变,而且与RNA及蛋白质可以在胞内大量合成不同,一般在一个原核细胞中只有一份DNA,在真核二倍体细胞中相同的DNA也只有一对,如果DNA的损伤或遗传信息的改变不能更正,对体细胞就可能影响其功能或生存,对生殖细胞则可能影响到后代。所以在进化过程中生物细胞所获得的修复DNA损伤的能力就显得十分重要,也是生物能保持遗传稳定性之所在。在细胞中能进行修复的生物大分子也就只有DNA,反映了DNA对生命的重要性。另一方面,在生物进化中突变又是与遗传相对立统一而普遍存在的现象,DNA分子的变化并不是全部都能被修复成原样的,正因为如此生物才会有变异、有进化。 一、DNA的损伤 (一)DNA损伤的原因 1.DNA分子的自发性损伤 (1)DNA复制中的错误 以DNA为模板按碱基配对进行DNA复制是一个严格而精确的事件,但也不是完全不发生错误的。碱基配对的错误频率约为10-1-10-2,在DNA复制酶的作用下碱基错误配对频率降到约10-5-10-6,复制过程中如有错误的核苷酸参入,DNA聚合酶还会暂停催化作用,以其3′-5′外切核酸酶的活性切除错误接上的核苷酸,然后再继续正确的复制,这种校正作用广泛存在于原核和真核的DNA聚合酶中,可以说是对DNA复制错误的修复形式,从而保证了复制的准确性。但校正后的错配率仍约在10-10左右,即每复制1010个核苷酸大概会有一个碱基的错误。 (2)DNA的自发性化学变化 生物体内DNA分子可以由于各种原因发生变化,至少有以下类型: a.碱基的异构互变 DNA中的4种碱基各自的异构体间都可以自发地相互变化(例如烯醇式与酮式碱基间的互变),这种变化就会使碱基配对间的氢键改变,可使腺嘌呤能配上胞嘧啶、胸腺嘧啶能配上鸟嘌呤等,如果这些配对发生在DNA复制时,就会造成子代DNA序列与亲代DNA不同的错误性损伤,如图1所示。  图1 腺嘌呤的稀有互变异体与胞嘧啶(a),或胸腺嘧啶的稀有互变异构体与鸟嘌呤 (b)的氢链形成导致下一世代中G-C配对取代A-T配对 b.碱基的脱氨基作用 碱基的环外氨基有时会自发脱落,从而胞嘧啶会变成尿嘧啶、腺嘌呤会变成次黄嘌呤(H)、鸟嘌呤会变成黄嘌呤(X)等,遇到复制时,U与A配对、H和X都与C配对就会导致子代DNA序列的错误变化。胞嘧啶自发脱氨基的频率约为每个细胞每天190个。 c.脱嘌呤与脱嘧啶 自发的水解可使嘌呤和嘧啶从DNA链的核糖磷酸骨架上脱落下来。一个哺乳类细胞在37℃条件下,20h内DNA链上自发脱落的嘌呤约1000个、嘧啶约500个:估计一个长寿命不复制繁殖的哺乳类细胞(如神经细胞)在整个生活期间自发脱嘌呤数约为108,约占细胞DNA中总嘌呤数的3%。 d.碱基修饰与链断裂 细胞呼吸的副产物O2、H2O2等会造成DNA损伤,能产生胸腺嘧啶乙二醇、羟甲基尿嘧啶等碱基修饰物,还可能引起DNA单链断裂等损伤,每个哺乳类细胞每天DNA单链断裂发生的频率约为5万次。此外,体内还可以发生DNA的甲基化,结构的其他变化等,这些损伤的积累可能导致老化。 由此可见,如果细胞不具备高效率的修复系统,生物的突变率将大大提高。 2.物理因素引起的DNA损伤 射线引起的DNA损伤是最引人注意的。 图2 胸腺嘧啶二聚体的形成 (1)紫外线引起的DNA损伤 DNA分子损伤最早就是从研究紫外线的效应开始的。当DNA受到最易被其吸收波长(~260nm)的紫外线照射时,主要是使同一条DNA链上相邻的嘧啶以共价键连成二聚体,相邻的两个T、或两个C、或C与T间都可以环丁基环(cyclobutane ring)连成二聚体,其中最容易形成的是TT二聚体,如图2所示。 人皮肤因受紫外线照射而形成二聚体的频率可达每小时5×104/细胞,但只局限在皮肤中,因为紫外线不能穿透皮肤。但微生物受紫外线照射后,就会影响其生存。紫外线照射还能引起DNA链断裂等损伤。 (2)电离辐射引起的DNA损伤 电离辐射损伤DNA有直接和间接的效应,直接效应是DNA直接吸收射线能量而遭损伤,间接效应是指DNA周围其他分子(主要是水分子)吸收射线能量产生具有很高反应活性的自由基进而损伤DNA。电离辐射可导致DNA分子的多种变化: a.碱基变化 主要是由OH-自由基引起,包括DNA链上的碱基氧化修饰、过氧化物的形成、碱基环的破坏和脱落等。一般嘧啶比嘌呤更敏感。 b.脱氧核糖变化 脱氧核糖上的每个碳原子和羟基上的氢都能与OH-反应,导致脱氧核糖分解,最后会引起DNA链断裂。 c.DNA链断裂 这是电离辐射引起的严重损伤事件,断链数随照射剂量而增加。射线的直接和间接作用都可能使脱氧核糖破坏或磷酸二酯键断开而致DNA链断裂。DNA双链中一条链断裂称单链断裂(single strand broken),DNA双链在同一处或相近处断裂称为双链断裂(doublestrand broken)。虽然单链断裂发生频率为双链断裂的10-20倍,但还比较容易修复;对单倍体细胞来说(如细菌)一次双链断裂就是致死事件。 d.交联 包括DNA链交联和DNA-蛋白质交联。同一条DNA链上或两条DNA链上的碱基间可以共价键结合,DNA与蛋白质之间也会以共价键相连,组蛋白、染色质中的非组蛋白、调控蛋白、与复制和转录有关的酶都会与DNA共价键连接。这些交联是细胞受电离辐射后在显微镜下看到的染色体畸变的分子基础,会影响细胞的功能和DNA复制。 3.化学因素引起的DNA损伤 化学因素对DNA损伤的认识最早来自对化学武器杀伤力的研究,以后对癌症化疗、化学致癌作用的研究使人们更重视突变剂或致癌剂对DNA的作用。 (1)烷化剂对DNA的损伤 烷化剂是一类亲电子的化合物,很容易与生物体中大分子的亲核位点起反应。烷化剂的作用可使DNA发生各种类型的损伤: a.碱基烷基化。烷化剂很容易将烷基加到DNA链中嘌呤或嘧啶的N或O上,其中鸟嘌呤的N7和腺嘌呤的N3最容易受攻击,烷基化的嘌呤碱基配对会发生变化,例如鸟嘌呤N7被烷化后就不再与胞嘧啶配对,而改与胸腺嘧啶配对,结果会使G-C转变成A-T。 b.碱基脱落。烷化鸟嘌呤的糖苷键不稳定,容易脱落形成DNA上无碱基的位点,复制时可以插入任何核苷酸,造成序列的改变。 c.断链。DNA链的磷酸二酯键上的氧也容易被烷化,结果形成不稳定的磷酸三酯键,易在糖与磷酸间发生水解,使DNA链断裂。 d.交联。烷化剂有两类,一类是单功能基烷化剂,如甲基甲烷碘酸,只能使一个位点烷基化;另一类是以双功能基烷化剂,化学武器如氮芥、硫芥等,一些抗癌药物如环磷酰胺、苯丁酸氮芥、丝裂霉素等,某些致癌物如二乙基亚硝胺等均属此类,其两个功能基可同时使两处烷基化,结果就能造成DNA链内、DNA链间,以及DNA与蛋白质间的交联。  图3 氮芥引起DNA分子两条链在鸟嘌呤上的交联 (a)交联附近的总图;(b)交联部分结构图 (2)碱基类似物、修饰剂对DNA的损伤 人工可以合成一些碱基类似物用作促突变剂或抗癌药物,如5-溴尿嘧啶(5-BU)、5-氟尿嘧啶(5-FU)、2-氨基腺嘌呤(2-AP)等。由于其结构与正常的碱基相似,进入细胞能替代正常的碱基参入到DNA链中而干扰DNA复制合成,例如5-BU结构与胸腺嘧啶十分相近,在酮式结构时与A配对,却又更容易成为烯醇式结构与G配对,在DNA复制时导致A-T转换为G-C。 还有一些人工合成或环境中存在的化学物质能专一修饰DNA链上的碱基或通过影响DNA复制而改变碱基序列,例如亚硝酸盐能使C脱氨变成U,经过复制就可使DNA上的G桟变成A桾对;羟胺能使T变成C,结果是A桾改成C桮对;黄曲霉素B也能专一攻击DNA上的碱基导致序列的变化,这些都是诱发突变的化学物质或致癌剂。 (二)DNA损伤的后果 上述损伤会最终导致DNA分子结构的变化,这种DNA分子水平上的突变(mutation)是整体遗传突变的基础。 归纳DNA损伤后分子最终的改变,有以下几种类型: 1.点突变(point mutation) 指DNA上单一碱基的变异。嘌呤替代嘌呤(A与G之间的相互替代)、嘧啶替代嘧啶(C与T之间的替代)称为转换(transition);嘌呤变嘧啶或嘧啶变嘌呤则称为颠换(transvertion)。 2.缺失(deletion) 指DNA链上一个或一段核苷酸的消失。 3.插入(insertion) 指一个或一段核苷酸插入到DNA链中。在为蛋白质编码的序列中如缺失及插入的核苷酸数不是3的整倍数,则发生读框移动(reading frame shift),使其后所译读的氨基酸序列全部混乱,称为移码突变(frameshift mutaion)。 4.倒位或转位(transposition) 指DNA链重组使其中一段核苷酸链方向倒置、或从一处迁移到另一处。 5.双链断裂 已如前述,对单倍体细胞一个双链断裂就是致死性事件。 突变或诱变对生物可能产生4种后果:①致死性;②丧失某些功能;③改变基因型(genotype)而不改变表现型(phenotype);④发生了有利于物种生存的结果,使生物进化。 二、DNA修复 DNA修复(DNA repairing)是细胞对DNA受损伤后的一种反应,这种反应可能使DNA结构恢复原样,重新能执行它原来的功能;但有时并非能完全消除DNA的损伤,只是使细胞能够耐受这种DNA的损伤而能继续生存。也许这未能完全修复而存留下来的损伤会在适合的条件下显示出来(如细胞的癌变等),但如果细胞不具备这修复功能,就无法对付经常发生的DNA损伤事件,就不能生存。所以研究DNA修复也是探索生命的一个重要方面,而且与军事医学、肿瘤学等密切相关。对不同的DNA损伤,细胞可以有不同的修复反应。 (一)回复修复 这是较简单的修复方式,一般都能将DNA修复到原样。 1.光修复 这是最早发现的DNA修复方式。修复是由细菌中的DNA光解酶(photolyase)完成,此酶能特异性识别紫外线造成的核酸链上相邻嘧啶共价结合的二聚体,并与其结合,这步反应不需要光;结合后如受300-600nm波长的光照射,则此酶就被激活,将二聚体分解为两个正常的嘧啶单体,然后酶从DNA链上释放,DNA恢复正常结构。后来发现类似的修复酶广泛存在于动植物中,人体细胞中也有发现。 2.单链断裂的重接 DNA单链断裂是常见的损伤,其中一部分可仅由DNA连接酶(ligase)参与而完全修复。此酶在各类生物各种细胞中都普遍存在,修复反应容易进行。但双链断裂几乎不能修复。  图4 损伤DNA的切除修复 3.碱基的直接插入 DNA链上嘌呤的脱落造成无嘌呤位点,能被DNA嘌呤插入酶(insertase)识别结合,在K+存在的条件下,催化游离嘌呤或脱氧嘌呤核苷插入生成糖苷键,且催化插入的碱基有高度专一性、与另一条链上的碱基严格配对,使DNA完全恢复。 4.烷基的转移 在细胞中发现有一种O6甲基鸟嘌呤甲基转移酶,能直接将甲基从DNA链鸟嘌呤O6位上的甲基移到蛋白质的半胱氨酸残基上而修复损伤的DNA。这个酶的修复能力并不很强,但在低剂量烷化剂作用下能诱导出此酶的修复活性。 (二)切除修复(excision repair) 是修复DNA损伤最为普遍的方式,对多种 图5 DNA损伤后重组修复 DNA损伤包括碱基脱落形成的无碱基位点、嘧啶二聚体、碱基烷基化、单链断裂等都能起修复作用。这种修复方式普遍存在于各种生物细胞中,也是人体细胞主要的DNA修复机制。修复过程需要多种酶的一系列作用,基本步骤如图4所示,①首先由核酸酶识别DNA的损伤位点,在损伤部位的5′侧切开磷酸二酯键。不同的DNA损伤需要不同的特殊核酸内切酶来识别和切割。②由5′→3′核酸外切酶将有损伤的DNA片段切除。③在DNA聚合酶的催化下,以完整的互补链为模板,按5′→3′方向DNA链,填补已切除的空隙。④由DNA连接酶将新合成的DNA片段与原来的DNA断链连接起来。这样完成的修复能使DNA恢复原来的结构。 (三)重组修复(recombinational repair) 上述的切除修复在切除损伤段落后是以原来正确的互补链为模板来合成新的段落而做到修复的。但在某些情况下没有互补链可以直接利用,例如在DNA复制进行时发生DNA损伤,此时DNA两条链已经分开,其修复可用图5所示的DNA重组方式:①受损伤的DNA链复制时,产生的子代DNA在损伤的对应部位出现缺口。② 另一条母链DNA与有缺口的子链DNA进行重组交换,将母链DNA上相应的片段填补子链缺口处,而母链DNA出现缺口。③以另一条子链DNA为模板,经DNA聚合酶催化合成一新DNA片段填补母链DNA的缺口,最后由DNA连接酶连接,完成修补。 重组修复不能完全去除损伤,损伤的DNA段落仍然保留在亲代DNA链上,只是重组修复后合成的DNA分子是不带有损伤的,但经多次复制后,损伤就被“冲淡”了,在子代细胞中只有一个细胞是带有损伤DNA的。 (四)SOS修复 “SOS”是国际上通用的紧急呼救信号。SOS修复是指DNA受到严重损伤、细胞处于危急状态时所诱导的一种DNA修复方式,修复结果只是能维持基因组的完整性,提高细胞的生成率,但留下的错误较多,故又称为错误倾向修复(errorprone repair),使细胞有较高的突变率。 图6 SOS修复 如图6所示,当DNA两条链的损伤邻近时,损伤不能被切除修复或重组修复,这时在核酸内切酶、外切酶的作用下造成损伤处的DNA链空缺,再由损伤诱导产生的一整套的特殊DNA聚合酶桽OS修复酶类,催化空缺部位DNA的合成,这时补上去的核苷酸几乎是随机的,但仍然保持了DNA双链的完整性,使细胞得以生存。但这种修复带给细胞很高的突变率。 应该说目前对真核细胞的DNA修复的反应类型、参与修复的酶类和修复机制了解还不多,但DNA损伤修复与突变、寿命、衰老、肿瘤发生、辐射效应、某些毒物的作用都有密切的关系。人类遗传性疾病已发现4000多种,其中不少与DNA修复缺陷有关,这些DNA修复缺陷的细胞表现出对辐射和致癌剂的敏感性增加。例如着色性干皮病(xeroderma pigmentosum)就是第一个发现的DNA修复缺陷性遗传病,患者皮肤和眼睛对太阳光特别是紫外线十分敏感,身体暴光部位的皮肤干燥脱屑、色素沉着、容易发生溃疡、皮肤癌发病率高,常伴有神经系统障碍,智力低下等,病人的细胞对嘧啶二聚体和烷基化的清除能力降低。 小? 结 环境和生物体内的因素都经常会使DNA的结构发生改变。DNA的复制会发生碱基的配对错误;体内DNA会有自发性结构变化,包括DNA链上的碱基异构互变、脱氨基、碱基修饰、DNA链上的碱基脱落等。外界射线的照射等物理因素,烷化剂、碱基类似物、修饰剂等化学因素都能损伤DNA的结构,变化包括有相邻嘧啶共价二聚体的形成、碱基、脱氧核糖和磷酸基团的烷基化和其它修饰、碱基脱落、DNA单链断裂、双链断裂、DNA链内交联、链间交联、DNA与周围的蛋白质交连等。最后能导致DNA的点突变、DNA核苷酸的缺失、插入或转位、DNA链的断裂等,结果可能影响生物细胞的功能和遗传特性,这些改变可能会导致细胞死亡、也有机会使细胞获得新的功能或进化,也可能细胞只有DNA结构的遗传性改变而没有表型变化,视DNA结构变化的部位、类型和范围不同而异。 生物在进化过程中获得的DNA修复功能,对生物的生存和维持遗传的稳定性是至关重要的。对有些DNA的损伤,细胞能将其完全修复到原样,如可将嘧啶二聚体切开、DNA单链断裂可重新连接、碱基缺失可再配对插入、加成的烷基可以移除、一条链上的碱基或核苷酸的错误可以切除并依赖互补链作模板而复制重新修复等。对DNA较严重的损伤,细胞可采取重组修复、SOS修复等方式进行反应,以期提高细胞的存活率,但不能完全消除DNA的损伤,会带给细胞较高的突变率。 DNA的损伤和修复与遗传、突变、寿命、衰老、辐射效应、肿瘤发生、某些毒剂的作用、以及某些遗传性疾病等有密切的关系。目前对DNA损伤修复的认识还不透彻 RNA的生物合成--转录作用 (The Biosynthesis of RNA) 执行生命功能、表现生命特征的主要物质是蛋白质分子。DNA贮存着决定生物特征的遗传信息,只有通过蛋白质才能表达出它的生命意义,直接决定蛋白质合成及蛋白质特征的不是RNA而是DNA,因而人们确定DNA是遗传信息贮存者后就推测DNA是通过RNA去决定蛋白质合成的。50年代末RNA聚合酶的发现开始证实了这一推测。 以DNA为模板合成RNA的过程称为转录(transcription)。转录是生物界RNA合成的主要方式,是遗传信息朋DNA向RNA传递过程,也是基因表达的开始(图1)。转录也是一种酶促的核苷酸聚合过程,所需的酶叫做依赖DNA的RNA聚合酶(DNA-dependent RNA polynerase ,DDRP)。转录产生初级转录物为RNA前体(RNA precursor),它们必须经过加工过程变为成熟的RNA,才能表现其生物活性。  ???图1 Expression of? genetic information by transcription.[Note:RNAs shown are eukaryotic.] 转录作用 RNA的转录合成从化学角度来讲类似于DNA的复制,多核苷酸链的合成都是以5’→3’的方向,在3’-OH末端与加入的核苷酸磷酸二酯键,但是,由于复制和转录的目的不同,转录又具有其特点:(1)对于一个基因组来说,转录只发生在一部分基因,而且每个基因的转录都受到相对独立的控制(图2);(2)转录是不对称的。(3)转录时不需要引物,而且RNA链的合成是连续的。 一、依赖DNA的RNA聚合酶 真核和原核细胞内都存在有DDRP,迄今发现的DDRP的有以下特点:①以DNA为模板;在DNA的两条多苷酸链中只有其中一条链作为模板,这条链叫做模板链(template strand),又叫做无意义链。DNA双链中另一条不做为模板的链叫做编码链,又叫做有意义链,编码链的的序列与转录本RNA的序列相同,只是在编码链上的T在转录本RNA为U,由于RNA的转录合成是以DNA的一条链为模板而进行的,所以这种转录方式又叫做不对称转录。②都以四种三磷酸核苷的底物,原料;③都遵循DNA与RNA之间的碱基配对原由,A=U,T=A,C=G,合成与模板DNA序列互补的RNA链。④RNA链的延长方向是5’→3’的连续合成。⑤需要Mg2+或Mn2+离子。⑥并不需要引物。RNA聚合酶缺乏3’→5’外切酶活性,所以没有校正功能。  图2 细菌染色体上几个基因转录的方向及所用模板 RNA聚合酶催化下列反应:  大肠杆菌RNA聚合酶的研究得比较透彻的,这是一个分子量达50多万,全酶由五咱亚基组成,去掉δ亚基的部分称为核心酶,核心酶本身就能催化苷酸间磷酸二酸键形成。利福平和利福霉素能结合在β亚基上而对此酶发生强烈的抑制作用。β亚基似乎是酶和核苷酸底物结合的部位。细胞内转录是在DNA特定的起始点上开始的,δ亚基的功能是辨认转录起始点的。β’亚基是酶与DNA模板结合的主要成分。α亚基可能与转录基因的类型和种类有关。 ??? 表1 大肠杆菌RNA聚合酶 亚单位 分子量 亚单位数目 功能  α β β δ 36512 150618 155613 70263 2 1 1 1 决定哪此基因被转录 与转录全过程有关 结合DNA模板 辨认起始点  真核生物中已发现有四种RNA聚合酶,分别称为RNA聚合酶Ⅰ、Ⅱ、Ⅲ和线粒体RNA聚合酶,分子量大致都在50万道尔顿左右,它们专一性地转录不同的基因,因此由它们催化的转录产物也各不相同。RNA聚Ⅰ合成RNA的活性最显著,它位于核仁中,负责转录编码rRNA的基因。而细胞内绝大部分RNA是rRNA是RNA。RNA聚合酶Ⅱ,位于核质中,负责核内不匀一RNA的合成,而hnRNA是mRNA的前体。RNA聚合酶Ⅲ负责合成tRNA和许多小的核内RNAs。鹅膏蕈碱是真核生物RNA聚合酶特异性抑制剂,三种真核生物RNA聚合酶对鹅膏蕈碱的反应不同,见表2,原核生物靠RNA聚合酶就可完成从起始、延长、终止的转录全过程,真核生物转录除RNA聚合酶外还需另一此叫做转录因子的蛋白质分子参与转录的全过程,见后叙。 ??? 表2 真核生物的RNA聚合酶 种类 分布 合成的RNA类型 对α-鹅膏蕈碱的敏感性  Ⅰ Ⅱ Ⅲ Mt 核仁 核质 核质 线粒体 rRNA hnRNA tRNA,5sRNA 线粒体RNAs 不敏感 低浓度敏感 高浓度敏感 不敏感  ?二、RNA的转录过程 ?转录的主要过程见图3,为研究和叙述方便,可将RNA合成分为识别与起始、延长和终止三个阶段。  图3 转录的主要过程 (一)识别 ?转录是从DNA分子的特定部位开始的,这个部位也是RNA聚合酶全酶结合的部信这就是启动子。为什么RNA聚合酶能够仅在启动子处结合呢?显然启动子处的核苷酸序列具有特殊性,为了方便,人们将在DNA上开始转录的第一个碱基定为+1,沿转录方向顺流而下的核苷酸序列均用正值表示;逆流而上的核苷酸序列均用负值表示。 ?对原核行物的100多个启动子的序列进行了比较后发现;在RNA转录起始点上游大约-10bp和-35bp处有两个保守的序列,在-10bp附近,有一组5’-TATAATpu的序列,这是Pribnow首先发现的称为Pribnow框,RNA聚合酶就结合在互部位上。-35bp附近,有一组5’-TTGACG-的序列;已被证实与转录起始的辨认有关,是RNA聚合酶中的δ亚基识别并结合的位置。-35序列的重要性还在于在很大程度上决定了启动子的强度。 由于RNA聚合酶分子很大,大约能覆盖70bp的DNA序列,因此酶分子上的一个适合部位就能占据从-35到-10序列区域(图4)。  图4 Structure of? the prokaryotic promoter region. 真核生物的启动子有其特殊性,真核生物有三种RNA聚合酶,每一咱都有自己的启动子类型。以RNA聚合酶Ⅱ的启动子结构为例,人们比较了上百个真核生物RNA聚合酶Ⅱ的启动子核苷酸序列伯发现;在-25区有TATA框,又称为Hogness框或Goldberg-Hogness框。其一致序列为T28A97A93A85A63T37A83A50T37,基本上都由A,T碱基所组成,离体转录实验表明,TATA框决定了转录起点的选择,天然缺少TATA框的基本可以从一个以上的位点开始转录。在-75区有CAAT框,其一致的序列为GGTCAATCT。有实验表明CAAT框与转录起始频率有关,例如缺失GG,兔子的β珠蛋白基因转录效率只有原来的12%(图5)。  图5 Eukaryotic gene promoter sequences ?除启动子外,真核生物转录起始点上游处还有一个称为增强子的序列,它能极大地增强启动子的活性,它的位置往往不固定,可存在于启动子上游或下游,对启动子来说它们正向排列和反向排列均有效,对异源的基因也起到增强作用,但许多实验证实它仍可能具有组织特异性,例如免疫球蛋白基因的增强子只有在B淋巴细胞内活性最高,胰岛素基因和胰凝乳蛋白酶基因的增哟子也都有很高的组织的特异性。 (二)转录起始和延伸 在原核生物中,当RNA聚合酶的δ亚基发现其识别位点时,全酶就与启动子的-35区序列结合形成一个封闭的启动子复合物。由于全酶分子较大,其另一端可在到-10区的序列,在某种作用下,整个酶分子向-10序列转移并与之牢固结合,在此处发生局部DNA12-17r 的解链形成全酶和启动子的开放性复合物。在开放性启动子复合物中起始位点和延长位点被相应的核苷酸前体充满,在RNA聚合酶β亚基催化下形成RNA的第一个磷酸二酸键。RNA合成的第一个核苷酸总有GTP或ATP,以GTP常见,此时δ因子从全酶解离下来,靠核心酶在DNA链上向下游滑动,而脱落的δ因子与另一个核心酶结合成全酶反复利用。  图6 转当起始复合物的模式 真核生物转录起始十分复杂,往往需要多种蛋白因子的协助,已经知道,在所有的细胞中有一类叫做转录因子的蛋白质分子,它们与RNA聚合酶Ⅱ形成转录起始复合物,共同参与转录起始的过程。 真核生物基因中,有专门为蛋白质编码的基因,这些基因由RNA聚合酶Ⅱ负责进行转录起始关键性作用。根据这些转录因子的作用特点可大致分为二类;第一类为普遍转录因子它们与RNA聚合酶Ⅱ共同组成转录起始复合物,转录才能在正确的位置上开始。普遍转录因子是由多种蛋白质分子组成的,其中包括特异结合在TATA盒上的蛋白质,叫做TATA盒结合蛋白,还有至成一组复合物叫做转录因子ⅡD。TFⅡD再与RNA聚合酶Ⅱ结合完成转录起始复合物的形成。(图6) ?除TFⅡD以外,在细胞核提取物中还发现TFⅡA,TFⅡF,TFⅡE,TFⅡH等,它们在转录起始复合物组装的不同阶段起作用,像TFⅡH就有旋转酶活性,它可利用ATP分解产生的能量,介导起始点双螺旋的打开,使RNA聚合酶得以发挥作用。从中也不难看出真核细胞中基因转录的起始是基因的表达调控的关键,这么多蛋白质分子之间相互作用,以及这些蛋白质分子DNA调控无件相结合,构成控制基因转录开始的复杂体系。 ?第二类转录因子为组织细胞特异性转录因子或者叫可诱导性转录因子,这此TF是在特异的组织细胞或是受到一些类固醇激素,生长因子或其它刺激后,开始表达某些特异蛋白质分子时,才需要的一类转录因子。 例如:激活剂蛋白-1就是一类可诱导的转录因子,它是由多蛋白质成份组成的复合物,可发由fos基因和jun基因家庭的蛋白质产物组成。当某些生长因子细胞因子和某些化学物质在细胞外刺激这些细胞时,使细胞内JUN蛋白和FOS蛋白发生磷酸化,特异地结合到c-jun基因和c-fos基因的启动子部位,使这些基因转录并翻译出相应的c-JUN蛋白和c-FOS蛋白,这些蛋白质就可组成二聚体的AP-1,AP-1就会结合到细胞核中靶基因的调控部位,促进或激活靶基因的转录活性,产生出由于细胞外刺激因素作用下,这些细胞做出的特异反应一表达出的特异蛋白须分子。有关详细内容见信号转录一章。 RNA链的延长靠核心酶的催化,在起始复合物上第一个GTP的核糖3’-OH上与DNA模板能配对的第二个三磷酸核苷起反应形成磷酸二酯键。聚合进去的核苷酸又有核糖3’-OH游离,这样就可按模板DNA的指引,一个接一个地延长下去。因此RNA链的合成方面也是5’--3。由于DNA链与合成的RNA链具有反平行关系,所以RNA聚合酶是沿着DNA链3’--5’方向移动。整个转录过程是由同一个RNA聚合酶来完成的一个连续下断的反应,转录本RNA生成后,暂时与DNA模板链形成DNA·RNA杂交体,长度约为12个碱基对,形成一个转录泡(图7)。转录速度大允是每秒钟30-50个核苷酸,但并不是以恒定速度进行的。在电子显微镜下观察转录现象,可以看到同一DNA模板上,有长短不一的新合成的RNA链散开成羽毛状图形,这说明在同一DNA基因上可以有很鑫的RNA聚合酶在同时催化转录,生成相应的RNA链。而且较长的RNA链上已看到核糖体附着,形成多聚核糖体。说明某些情况下,转录过程未完全终止,即已开始进行翻译。  图7 Diagrammatic representation of DNA transcription by E.coli RNA polymerase.The polymerase unwinds a stretch of DNA about 17base pairs in length forming a transcriptional bubble thatprogresses along thd DNA.The DNA has to unwind ahead of the polymerase and rewind behind it .The newly formed RNA forms a RNA-DNA double helix about 12 bae pairs long. 转录的延长阶段,原核生物与真核生物之间没有太大差别。 (三)转录的终止(Termination) 转录是在DNA模板某一位置上停止的,人们比较了若干原核生物RNA转录终止位点附近的DNA序列,发现DNA模板上的转录终止信号有两种情况,一类是不依赖于蛋白质因子而实现的终止作用,另一类是依赖蛋白质辅因子才能实现终止作用,这种蛋白质辅因子称为释放因子,通常又称ρ因子。两类终止信号有共同的序列特征,在转录终止之前有一段回文结构,回文序列是一段方向相反,碱基互补的序列,在这段互补序列之间由几个碱基隔开,不依赖ρ因子的终止序列中富含G·C碱基对,其下游6-8个A;而依赖ρ因子的终止序列中G·C碱基对含量较少,其少游也没有因固定的特征,其转录生成的RNA可形成二级结构即柄一噜噗结构,又称发夹结构,这样的二级结构可能与RNA聚合酶某种特定的空间结构相嵌合,阻碍了RNA聚合酶进一步发挥作用(图8)。除DNA模板本身的终止信号外,在入噬菌体中,发现一些蛋白质有协助RNA聚合酶跨越终止部位的作用,叫做抗转录终止蛋白,例如入噬菌体的N基因产物。  图8 原核生物转录作用的终止信号 真核生物由于RNA转录后很快就进行了加工,因此很难确定原初转录物的3’末端。病毒SV40的终止位点经过研究发现,很像大肠杆菌的不依赖ρ因子的终止子,转录后的RNA可形成一个发夹结构,3’末端带有一连串的U。爪蟾5sRNA的3’末端有4个U,它们前后的序列为富含G·C的序列,这是所有真核生物RNA聚合酶Ⅲ转录的终止信号。这种序列特征高度保守,从酵母到人都很相似,任何改变这种序列特征的突变都将导致转录终止位置的改变。 RNA转录后的加工与修饰 不论原核或真核生物的rRNAs都是以更为复杂的初级转录本形式被合成的,然后再加工成为成熟的RNA分子。然而绝大多数原核生物转录和翻译是同时进行的,随着mRNA开始的DNA上合成,核蛋白体即附着在mRNA上并以其为模板进行蛋白质的合成,因此原核细胞的mRNA并无特殊的转录后加工过程,相反,真核生物转录和翻译在时间和空间上是分天的,刚转录出来的mRNA是分子很大的前体,即核内不均一RNA。hnRNA分子中大约只有10%的部分转变成成熟的mRNA,其余部分将在转录后的加工过程中被降解掉。 (一)mRNA的加工修饰 原核生物中转录生成的mRNA为多顺反子,即几个结构基因,利用共同的启动子和共同终止信号经转录生成一条mRNA,所以此mRNA分子编码几种不同的蛋白质。例如乳糖操纵子上的Z、Y及A基因,转录生成的mRNA可翻译生成三种酶,即半乳糖苷酶,透过酶和乙酰基转移酶。原核 生物中没有核模,所以转录与翻译是连续进行的,往往转录还未完成,翻译已经开始了,因此原核生物中转录生成的mRNA没有特殊的转录后加工修饰过程。 真核生物转录生成的mRNA为单顺反子,即一个mRNA分子只为一种蛋白质分子编码。 真核生物mRNA的加工修饰,主要包括对5’端和3’端的修饰以及对中间部分进行剪接。 1.在5’端加帽 成熟的真核生物mRNA,其结构的5’端都有一个m7G-PPNmN结构,该结构被称为甲基鸟苷的帽子。如图1所示。鸟苷通过5’-5’焦磷酸键与初级转录物的5’端相连。当鸟苷上第7位碳原子被甲基化形成m7G-PPNmN时,此时形成的帽子被称为“帽0”,如果附m7G-PPNmN外,这个核糖的第“2”号碳上也甲基化,形成m7G-PPNm,称为“帽1”,如果5’末端N1和N2中的两个核糖均甲基化,成为m7G-PPNmPNm2,称为“帽2”。从真核生物帽子结构形成的复杂可以看出,生物进化程度越高,其帽子结构越复杂。  图1 Post-transcriptional modification of mRNA showing the 7-methylguanosine cap and poly-A tail.? 真核生物mRNA 5’端帽子结构的重要性在于它是mRNA 做为翻译起始的必要的结构,对核糖体对mRNA的识别提供了信号,这种帽子结构还可能增加mRNA的稳定性,保护mRNA 免遭5’外切核酸酶的攻击。 2.在3’端加尾 大多数的真核mRNA 都有3’端的多聚尾巴(A),多聚(A)尾巴大约为200bp。 多聚(A)屠巴不是由DNA编码的,而是转录后在核内加上去的。受polyA聚合酶催化,该酶能识别,mRNA 的游离3’-OH端,并加上约200个A残基。 ? 近年来已知,在大多数真核基因的3’一端有一个AATAA序列,这个序列是mRNA 3’-端加polyA尾的信号。靠核酸酶在此信号下游10-15碱基外切断磷酸二酯键,在polyA聚合酶催化下,在3’-OH上逐一引入100-200个A碱基。关于polyA尾巴的功能问题尽管经过极其广泛的探索,但还不完全清楚。有人推测polyA可能与mRNA从细胞核转送到细胞质有关,但是相当数量,的没有polyA屠巴的mRNA如组蛋白mRNA,也照样通过核膜进入细胞质。还有人认为这种结构对真核mRNA的翻译效率具有某种作用,并能稳定mRNA结构,保持一定的生物半衰期。 3.mRNA前体(hnRNA)的拼接 原核生物的结构基因是连续编码序列,而真核生物基因往往是断裂基因,即编码一个蛋白质分子的核苷酸序列被多个插入片断所隔开,一个真核生物结构基因中内含子的数量,往往与这个基因的大小有关,例如胰岛素是一个很小的蛋白质,它结构基因只有两个内含子,而有些很大的蛋白质,它的结构基因中可以有几十个内含子。经过复杂的过程后,切去内元,将有编码意义的核苷酸片段(Extron外元也叫外显子)连接起来(图2)。 图2 Primary polymerase 11transcript of a eukaryote gene showing (a)introns after capping and addition of polyA tail.(b)Excision of introns to form the mature mRNA is called splicing. 真核生物的结构的基因中具有可表达活性的外显子,也含有无表达活性的内含子,但内含子序列下是无意义的,越来越多的实验证明有许多基因中的内含子参与基因表达调控,在转录时,外显子及内含子均转录到hnRNA中。在细胞核中hnRNA进行剪接作用,首先在核酸内切酶作用下剪切掉内含子;然后在连接酶作用下,将外显子各部分连接起来,而变为成熟的mRNA,这就是剪接作用,也有少数基因的hnRNA不需进行剪接作用,例如α-干扰素基因,图3以卵清蛋白基因为例,介绍一个典型的转录及加工过程。需要在拼接部位有供拼接识别的保守性强的一致顺序,通过对100多种真核细胞基因的分析,发现外元和内元拼接部位部分碱基顺序有一定的规律(见表1)。  图3 卵清蛋白基因转录及加工过程 图中外显示以1、2、3、4……表示,内含子以A、B、C、D…表示 表1 含有内元的转录产物其拼接处的碱基顺序 基因区域 Exon Intron Exon  卵清蛋白内元2 UAAG GUGA ~~~~~~~ ACAGGUUG  卵清蛋白内元3 UCAG GUAC ~~~~~~~ UCAGUCUG  β-珠蛋白内元1 GCAG GUUG ~~~~~~~ UCAGGCUG  β-珠蛋白内元2 CAGG GUGA ~~~~~~~ ACAGUCUC  Igλ内含子1 UCAG GUCA ~~~~~~~ GCAGGGGC  SV40病毒早期T抗原 UAAG GUAA ~~~~~~~ UUAGAUUC  表中划线的碱基对拼接识别有重要作用,如将兔的β-珠蛋白的拼接部位的GT改为AT后,拼接反应即受到影响。 mRNA前体拼机制  图4 The RNA splicing mechanism.RNA splicing is catalyzed by a spliceosome formed from the assembly of U1,U2,U5,and sn RNPs(shown as green circles )plus other components (not shown).After assembly of the spliceosome ,the reaction occures in two speps:in step 1the branch-point A nucleotide in the intron sequence,which is located colse to the 3'splice site ,attacks the 5'splice site and cleaves it;the cut 5'end of the intron sequence thereby becomes covalently linked to this A nucleotide,forming the branched nucleotide shown in Figure 8-55.In step 2 the 3'-OH end of the first exon sequence,which was created in the first step,adds to the beginning of the second exon sequence,cleqving the RNA molecule at the 3'splice site;the two exon sequences are thereby joined to each other and the intron sequence is released ad a ribosone.These splicing reactions occur im the nucleus and gengerate mRNA molecules from primary RNA transcripts (mRNA precursor molecules).? mRNA拼接反应需要有核内小分子RNA参与它们与蛋白质形成的复合物称为小核糖核蛋白颗粒,SnRNA分别被命名为U1,U2,U3,U4,U5,和U6RNA。SnRNA中的U2RNA由与内元右端拼接部位附近的UACUAA顺序高度互补,形成一个环状结构,由特定的酶来识别切除该环状结构,完成拼接过程,如图4所示。 图5 Mechanim of mRNA splicing.Note that,for clarity,the process is shown in two stages;energy is not required for the process since transesterification reactions are involved. 真核生物 mRNA前体在剪接过程中,还可以形成套索样的结构,在内含子序列中常有一个分支部位的腺苷酸残基,它的2’-OH可以自动攻击内含子5’端与外显子1连接的磷酸二酯键,切开了外噗子1,而腺苷酸原来已有3’,5’--磷酸二酯键相连的两个相邻的核苷酸残基,加上此3’,5’-磷酸二酯键连接后,在腺苷酸处出现了一个套索,已被切下的外显子1的3’-OH攻击内含子3’末端与外显子2之间的3’,5’-磷酸二酯键,键断裂后,内含子以套索的形式被节下来,此时外显子1和外显子2可以连接起来(图5)。 不论拼接过程如何,拼接必须极为精确,否则会导致遗传信息传递障碍,合成的蛋白质可能丧失其正常的功能。我国南方广大地区是β-地中海贫血的高发区,这是由于β-珠蛋白链的合成受到部分或完全抑制所引起的一种血红蛋白病。实验表明β-珠蛋白基因元1中核苷酸的点突变改变了正常拼接部位的碱基顺序,结果造成错误部位的拼接。加工成熟的 mRNA虽能翻译,但产物不是正常的β-珠蛋白,结果引起血红蛋白级结构和功能的改变。 (二)rRNA转录后加工 原核生物rRNA转录后加工,包括以下几方面:①rRNA前体被大肠杆菌RNaseⅢ,RNaseE等剪切成一定链长的rRNA分子;②rRNA在修饰酶催化下进行碱基修饰;③rRNA与蛋白质结合形成核糖体的大、小亚基(见图6) ??? 图6 大肠杆菌rRNA前体的加工 真核生物rRNA前体比原核生物大,哺乳动物的初级转录产物为45s,低等真核生物的rRNA前体为38s,真核生物5sRNA前体独立于其他三种rRNA的基因转录(图7)。  图7 真核生物rRNA前体的加工 真核生物rRNA前体中含有插入顺序,rRNA前体要形成成熟的rRNA,需要经过拼接反应。例如,四膜虫的rRNA前体的拼接是一种无酶催化的自动拼接过程。四膜虫基因组内,26srRNA编码的区域内有413bp的插入顺序。该插放序列可以不消耗能量从rRNA前体中被除掉。用SDS煮沸和用蛋白酶外理等破坏酶活性办法,都不能破坏拼接活性,但反应中Mg2+和鸟嘌呤核苷酸是必在的。用32P-GTP进行追踪实验表明,起始过程是GTP在插入顺序5’端发生亲核反应,同时GMP与5’端切点的切除段形成磷酸二酯键并使原RNA断开。第二步是5’切点的外元3’-OH与3’切点的外元5’-P共价连接,获得成熟的rRNA,被切除部分最后环化,形成一个环状结构,同时从5’端去掉一个15核苷酸啐片。剩余部分连接成399核苷酸的环状产物,再经过几步,最后切下一个19个核苷酸的线性内含子序列即L-19,它具有催化活性,上面的剪接作用,是由内含子本身的催化性质决定的(图8)。  图8 四膜虫rRNA前体的自我剪接 ?这种rRNA的自身剪接反应给人们一个提示:即RNA分子也有酶的催化活性。这向酶的化学 本质是蛋白质这一传统概念提出了挑战。这种有酶催化活性的RNA分子命名为Ribozyme。T.Cech和 S.Altman各自分别发现RNA具有催化作用,他们的发现对于了解生命进行过程有重要意义。很可能在原始生命中,RNA所催化的断裂一连接反应是最早出现的催化过程。为此,他们共同获得了1989年Nobel化学奖。 从大多数Ribozymw的结构中发现一些特征,例如:锤头状结构的RNA分子有13个保守的核苷酸序列,如果它们中的碱基改变会使这种催化活性失去作用。根据这种特片,科学家们在体外没计并人工合成这种RNA分子,用于抗肿瘤及抗病毒的实验中(图9)。 图9 锤头结构模式图 (三)tRNA转录后的加工修饰 原核生物和真核生物刚转录生成的tRNA前体一般无生物活性,需要进行①剪切和拼接②碱基修饰③3’-OH连接-ACC结构(图10)。  图10 tRNA前体的加工 ①tRNA前体在tRNA剪切酶的作用下,切成一定在小的tRNA分子。大肠杆菌RNase P可特异剪切tRNA前体的5’旁顺序,因此,该酶被称为tRNA5’成熟酶。除了RNaseP外,tRNA前体的剪切尚需要一个3’-核酸内切酶,这可将tRNA前体3’端的一段核苷酸序列切下来。此外RNaseD是tRNA3’端成熟酶。近年来的研究表明大肠杆菌RNaseP是一种非常特殊的酶分子,它是由RNA和蛋白质组成,最近发现RNAaseP分子中的RNA部分在某些条件下,可以单独地催化tRNA前体的加工成熟,这个发现和四膜虫tRNA能自我拼接被认为是近十年来生化领域内最令人鼓舞的发现之一。说明RNA分子确具有酶的催化活性。经过剪切后的tRNA分子还要在拼接酶作用下,将成熟tRNA分子所需的片段拼起来。 ②成熟的tRNA分子中有许多的稀有碱基,因此tRNA在甲基转移酶催化下,某些嘌呤生成甲基嘌呤如A→mA,G→mA。有些尿嘧啶还原为双氢尿嘧啶。尿嘧啶核苷转变不假尿嘧啶核苷。某些腺苷酸脱氨基为成为次黄嘌呤核苷酸(Ⅰ) ③3’末端加上CCA:在核苷酸转移酶作用下,3’--末端除去个别碱基后,换上tRNA分子统一的CCA-OH末端,完成tRNA分子中的氨基酸臂结构。 RNA的复制 以DNA为模板合成RNA是生物界RNA合成的主要方式,但有些生物像某些病毒,噬菌体它们的遗传信息贮存在RNA分子中,当它们进入宿细胞后,靠复制而传代,它们在RNA指导的RNA聚合酶催化下合成RNA分子,当以RNA模板时,在RNA复制酶作用下,按5'→3'方向合成互补的RNA分子,但RNA复制酶中缺乏校正功能,因此RNA复制时错误率很高,这与反转录酶的特点相似.RNA复制酶只对病毒本身的RNA起作用,而不会作用于宿主细胞中的RNA分子。 ??? 小? 结 转录是以DNA为模板合成RNA的过程,经过转录DNA分子中的贮存信息传递到RNA分子中,再由mRNA做为模板合成蛋白质分子,转录也是从DNA的一个特定位置开始的,以DNA分子中的一条链为模板,在RNA聚合酶作用下,以四种单核苷酸为原料,合成方向仍是5'→3',完成RNA的合成. 大肠杆菌的RNA聚合酶由五个亚基构成,α2ββ'构成核心酶,再加上σ因子是全酶。RNA聚合酶识别并特异结合的DNA一段区域叫做启动子,启动子的序列中一10区和一35区很保守,决定了启动子的强度是转录正确起点的关键,真核生物中位于--20的TATA盒和--70--110区域的元件是控制真核生物RNA的转录的关键。真核生物的RNA聚合酶有Ⅰ、Ⅱ、ⅢTMtn几种,它们分别催化rRNA、mRNAt、tRNA Usn RNA、tRNA、以及线粒体RNA的合成。转录作用停止于DNA模板的终止信号,蛋白质ρ因子可识别此信号,终止区常常转录出一段反向重复序列。 转录生成的RNA分子为前体RNA,必须经过必在的加工修饰,才能成为有功能的RNA分子,但真核生物的RNA转录后加工修饰比原生物复杂的多。原核生物转录生成的mRNA属于多顺反子形式,由于原核生物没有核膜,转录与翻译的过程没有明显的屏障。而真核生物转录生成的mRNA为单顺反子,而且具有复杂的转录加工修饰,包括5’端加幅,3’端加尾,剪切内含子,连接外显子等等,人们在研究rRNA前体的加工过程中发现了具有催化作用的RNA分子,称为酶RNA,从而打破了酶的本质是蛋白质的传统观念。 蛋白质的生物合成 (The Biosynthesis of protein) 蛋白质分子是由许多氨基酸组成的,在不同的蛋白质分子中,氨基酸有着特定的排列顺序,这种特定的排列顺序不是随机的,而是严格按照蛋白质的编码基因中的碱基排列顺序决定的。基因的遗传信息在转录过程中从DNA转移到mRNA,再由mRNA将这种遗传信息表达为蛋白质中氨基酸顺序的过程叫做翻译。翻译的过程也就是蛋白质分子生物合成的过程,在此过程中需要200多种生物大分子参加,其中包括核糖体、mRNA、tRNA及多种蛋白质因子。翻译基本过程如图1。  图1 翻译过程的基本原理 参与蛋白质生物合成的物质 (一)合成原料 自然界由mRNA编码的氨基酸共有20种,只有这些氨基酸能够作为蛋白质生物合成的直接原料。某些蛋白质分子还含有羟脯氨酸、羟赖氨酸、γ-羧基谷氨酸等,这些特殊氨基酸是在肽链合成后的加工修饰过程中形成的。 (二)mRNA是合成蛋白质的直接模板 原核细胞中每种mRNA分子常带有多个功能相关蛋白质的编码信息,以一种多顺反子的形式排列,在翻译过程中可同时合成几种蛋白质,而真核细胞中,每种mRNA一般只带有一种蛋白质编码信息,是单顺反子的形式。mRNA以它分子中的核苷酸排列顺序携带从DNA传递来的遗传信息,作为蛋白质生物合成的直接模板,决定蛋白质分子中的氨基酸排列顺序。不同的蛋白质有各自不同的mRNA,mRNA除含有编码区外,两端还有非编码区。非编码区对于mRNA的模板活性是必需的,特别是5’端非编码区在蛋白质合成中被认为是与核糖体结合的部位。见图2。  图2 (a)原核生物mRNA)为多顺反子 (b)真核生物mRNA为单顺反子 mRNA分子上以5'→3'方向,从AUG开始每三个连续的核苷酸组成一个密码子,mRNA中的四种碱基可以组成64种密码子。这些密码不仅代表了20种氨基酸,还决定了翻译过程的起始与终止位置。每种氨基酸至少有一种密码子,最多的有6种密码子。从对遗传密码性质的推论到决定各个密码子的含义,进而全部阐明遗传密码,是科学上最杰出的成就之一,科学家们设计了十分出色的遗传学和生物化学实验,于1966年编排出了遗传密码字典。见表1。 表1 氨基酸的密码(code) 5’末端(第1位碱基) 中间碱基(第二位碱基) 3’末端(第三位碱基)   U C A G   U 苯丙(Pne)F 丝(Ser)S 酪(Tyr)Y 半胱(Cys)C U   苯内(Pne) 丝(Ser) 酪(Tyr) 半胱(Cys) C   亮(Leu)L 丝(Ser) 终止信号 终止信号 A   亮(Leu) 丝(Ser) 终止信号 色(Trp) G  C 亮(Leu) 脯(Pro)P 组(His)H 精(Arg)R U   亮(Leu) 脯(Pro) 组(His) 精(Arg) C   亮(Leu) 脯(Pro) 谷胺(Gin)Q 精(Arg) A   亮(Leu) 脯(Pro) 谷胺(Gin) 精(Arg) G  A        异亮(ILe)I 苏(Thr)T 天胺(Asn)N 丝(Ser)S U   异亮(ILe) 苏(Thr) 天胺(Asn) 丝(Ser) C   异亮(ILe) 苏(Thr) 赖(Lys)K 精(Arg)R A   *蛋(Met)M(起动信号) 苏(Thr) 赖(Lys) 精(Arg) G  G        缬(Val)V 丙(Ala)A 天(Asp)D 甘(Gly)G U   缬(Val) 丙(Ala) 天(Asp) 甘(Gly) C   缬(Val) 丙(Ala) 谷(Glu)E 甘(Gly) A   缬(Val) 丙(Ala) 谷(Glu) 甘(Gly) G  *位于mRNA起动部位AUG为氨基酸合成肽链的起动信号。以哺乳动物为代表的真核生物,此密码子代表蛋氨酸;以微生物为代表的原核生物则代表甲酰蛋氨酸。 遗传密码具有以下几种特点: (1)起始码与终止码(Initiation codon and termination codon): 密码子AUG是起始密码,代表合成肽链的第一个氨基酸的位置,它们位于mRNA5′末端,同时它也是蛋氨酸的密码子,因此原核生物和真核生物多肽链合成的第一个氨基酸都是蛋氨酸,当然少数细菌中也用GUG做为起始码。在真核生物CUG偶尔也用作起始蛋氨酸的密码。密码子UAA,UAG,UGA是肽链成的终止密码,不代表任何氨基酸,它们单独或共同存在于mRNA3’末端。因此翻译是沿着mRNA分子5′→3′方向进行的。 (2)密码无标点符号:两个密码子之间没有任何核苷酸隔天,因此从起始码AUG开始,三个碱基代有一个氨基酸,这就构成了一个连续不断的读框,直至终止码。如果在读框中间插入或缺失一个碱基就会造成移码突变,引起突变位点下游氨基排列的错误。 (3)密码的简并性(Degemeracy): 一种氨基酸有几组密码子,或者几组密码子代表一种氨基酸的现象称为密码子的简并性,这种简并性主要是由于密码子的第三个碱基发生摆动现象形成的,也就是说密码子的专一性主要由前两个碱基决定,即使第三个碱基发生突变也能翻译出正确的氨基酸,这对于保证物种的稳定性有一定意义。如:GCU,GCC,GCA,GCG都代表丙氨酸。 (4)密码的通用性: 大量的事实证明生命世界从低等到高等,都使用一套密码,也就是说遗传密码在很长的进化时期中保持不变。因此这张密码表是生物界通用的。然而,出乎人们预料的是,真核生物线粒体的密码子有许多不同于通用密码,例如人线粒体中,UGA不是终止码,而是色氨酸的密码子,AGA,AGG不是精氨酸的密码子,而是终止密码子,加上通用密码中的UAA和UAG,线粒体中共有四组终止码。内部甲硫氨酸密码子有两个,即AUG和AUA;而起始甲硫氨酸密码子有四组,即AUN。 密码子结构与氨基酸侧链析性之间也有一定关系。①氨基酸侧链极性性质在多数情况下由断面子的第二个碱基决定。第二个碱基为嘧啶(Y)时,氨基酸侧链为非极性,第二个碱基为嘌呤时,氨基酸侧链则有极性。②当第一个碱基为U或A,第二个碱基为C,第三个碱基无特异性时,所决定的氨基酸侧链为极性不带电。③当第一个碱基不是U,第二个碱基是P时,氨基酸侧链则带电。在此前提下,若是一个是C或A时,表示带正电的氨基酸,第一、二个碱基分别是G、A时,此种氨革酸带负电,但上述关系也有个别例外。 一种氨基酸由多种密码子所编码的事实使人想到:同一种氨基酸的一组密码子的使用频率是否相同?许多实验证实,在原核生物和高等真核生物中同一组密码子的使用频率是不相同的。高频密码子多出现在那些表达量高的蛋白质基因中,例如,核糖体蛋白质基因,RecA蛋白质基因等。表2。这种使用频率与细胞内一组tRNA中的不同tRNA含量有关。  (三)tRNA是氨基酸的运载工具: tRNA在蛋白质生物合成过程中起关键作用。mRNA推带的遗传信息被翻译成蛋白质一级结构,但是mRNA分子与氨基酸分子之间并无直接的对应关系。这就需要经过第三者“介绍”,而tRNA分子就充当这个角色。tRNA是类小分子RNA,长度为73-94个核苷酸,tRNA分子中富含稀有碱基和修饰碱基,tRNA分子3’端均为CCA序列,氨基酸分子通过共价键与A结合,此处的结构也叫氨基酸臂。每种氨基酸都有2-6种各自特异的tRNA,它们之间的特异性是靠氨基酰tRNA合成酶来识别的。这样,携带相同氨基酸而反密码子不同的一组tRNA称为同功tRNA,它们在细胞内合成量上有多和少的差别,分别称为主要tRNA和次要tRNA。主要tRNA中反密码子识别tRNA中的高频密码子,而次要tRNA中反密码子识别mRNA中的低频密码子。每种氨基酸都只有一种氨基酰tRNA合成酶。因此细胞内有20种氨基酰tRNA合成酶。 图3 密码子和反密码子的相互作用 tRNA分子中还有一个反密码环,此环上的三个反密码子的作用是与mRNA分子中的密码子靠碱基配对原则而形成氢键,达到相互识别的目的。但在密码子与反密码子结合时具有一定摆动性,即密码子的第3位碱基与反密码子的第1位碱基酸对时并不严格,见图3。配对摆动性完全是由tRNA反密码子的空间结构所决定的。反密码的第1位碱基常出现次黄嘌呤I,与A、C、U之间皆可形成氢键而结合,这是最常见的摆动现象。这种摆动现象使得一个tRNA所携带的氨基酸可排列在2-3个不同的密码子上,因此当密码子的第3位碱基发生一定程度的突变时,并不影响tRNA带入正确的氨基酸。 表3 反密码与密码碱基配对时的摇摆现象 反密码第1位碱基 A C G U 1  密码第3位碱基 U G C,U A,G A,C,U  在蛋白质生物合成过程中,特异识别mRNA上起始密码子的tRNA被称为起始tRNA,它们参加多肽链合成的起始,其它在多肽链延伸中运载氨基酸的tRNA,统称为延伸tRNA。 (四)核糖核蛋白体 核蛋白体是由rRNA和几十种蛋白质组成的亚细胞颗粒,位于胞浆内,可分为两类,一类附着于粗面内质网,主要参与白蛋白、胰岛素等分泌性蛋白质的合成,另一类游离于胞浆,主要参与细胞固有蛋白质的合成。核糖体是细胞中的主要成分之一,在一个生长旺盛的细菌中大约不20000个核糖体,其中蛋白质占细胞总蛋白质的10%,RNA占细胞总RNA的80%。 任何生物的核糖体都是由大、小两个亚基组成,现将大肠杆菌核糖体和大鼠肝细胞核糖体的蛋白质组分和RNA组成列表于4。1968年已在体外对大肠杆菌小亚基进行了自我装配研究,加入16s rRNA和21种蛋白质,即可形成有天然活性的30s小亚基。通过这些研究使人们能够进一步认识小亚基和大亚基中rRNA与蛋白质的特异功能。核糖体是高度复杂的体系,它的任何个别组分或局部组分都不能起整体的作用,因此必须研究核糖体中蛋白质和RNA的空间结构和位置,才能更完全地了解蛋白质合成的具体过程。过去一直认为rRNA主要起着结构上的作用,蛋白质发挥催化功能,但现在认为rRNA与蛋白质共同的构成的核糖体功能区是核蛋白体表现功能的重要部位,如GTP酶功能区,转肽酶功能区以及mRNA功能区等等。 表4 核蛋白体的组成及特性 来源 直径(毫微米) 重量(道尔顿) 含rRNA(%) 含蛋白质(%) 沉降系数 亚基 含rRNA 含蛋白质种数 每个细胞内含有的个数         种类 分子量    真核细胞胞液 20~22 3.6×106 55 45 77S~80s 40S(小) 18S -70万 ~34 106~107        60S(大) 5S 5.8S 28S~29S 3万 4万 140~180万 ~40   原核细胞胞液 18 2.6×106 60~65 30~35 70S 30S(小) 16S 55万 ~34 1.5×104        50S(大) 5S 23S 4万 110万    注:真核细胞线粒体的核蛋白体组成及特性与原核细胞胞液的相同 核蛋白体作为蛋白质的合成场所具有以下几种作用: (1)mRNA结合位点:位于30s小亚基头部,此处有几种蛋白质构成一个上的结构域,负丙与mRNA的结合,特别是16srRNA3’端与mRNA AUG之前的一段序列互补是这种结合必不可少的,见表5。 表5 大肠杆菌mRNA起始密码上游区域SD序列和16s rRNA的互补 16s rRNA MS2外壳蛋白 MS2复制酶 MS2A蛋白 λCro galE β-内酰氨酶 脂蛋白 核糖体蛋白S12 RNA聚合酶β trpE 3’HOAU UCCUCCACUAG……5’ 5’……UCAACC GGAGUUUGAAUCAUG…3’ 5’……CAAACAU GAGGAUUACCCAUG …3’ 5’…… UCCU AGGAGGUUUGACCUGUG…3’ 5’…… AUGUAC UAAGGAGGUUGUAUG…3’ 5’…… AGCCUAAU GGAGCGAAUUAUG…3’ 5’…… UAUUGAAA AAGGAAGAGUAUG…3’ 5’…… AUCUA GAGGGUAUUAAUAAUG…3’ 5’…… AAAACCAGGAGCUAUUUAAUG…3’ 5’…… AGCGAGCU GAGGAACCCUAUG…3’ 5’…… CAAAAUUAGAGAAUAACAAUG…3’  (2)P位点:(peptidyl tRNA site) 又叫做肽酰基tRNA位或给位。它大部分位于小亚基,小部分位于大亚基,它是结合起始 tRNA 并向A位给出氨基酸的位置(图4)。 图4 翻译过程中的核糖体图解 (3)A位点:(Aminoacyl-tRNA site) 叫做氨基酰 tRNA 位或受位。它大部分位于大亚基而小部分位于小亚基,它是结合一个新进入的氨基酰 tRNA 的位置(见后节叙述)。 (4)转肽酶活性部位: 位于P位和A位的连接处。 (5)结合参与蛋白质合成的起始因了(Initiation Factor,IF)、延长因子(Elengation Factor,EF)和终止因子或释放因子(Release Factor,RF)。 蛋白质生物合成过程 蛋白质生的合成亦称为翻译(Translation),即把mRNA分子中碱基排列顺序转变为蛋折质或多肽链中的氨基酸排列顺序过程。这也是基因表达的第二步,产生基因产物蛋白质的最后节段。不同的组织细胞具有不同的生理功能,是因为它们表达不同的基因,产生具有特殊功能的蛋白质,参与蛋白质生物合成的成份至少有200种,其主要体第主要由mRNA、tRNA、核糖核蛋白体以及有关的酶和蛋白质因子共同组成。 原核生物与真核生物的蛋白质合成过程中有很多的区别,真核生物此过程更复杂,下面着重介绍原核生物蛋白质合成的过程,并指出真核生物与其不同这处。 蛋白质生物合成可分为五个阶段,氨基酸的活化、多肽链合成的起始、肽链的延长、肽链的终止和释放、蛋白质合成后的加工修饰。 (一)氨基酸 在进行合成多肽链之前,必须先经过活化,然后再与其特异的tRNA结合,带到mRNA相应的位置上,这个过程靠氨基酰tRNA合成酶催化,此酶催化特定的氨基酸与特异的tRNA相结合,生成各种氨基酰tRNA.每种氨基酸都靠其特有合成酶催化,使之和相对应的tRNA结合,在氨基酰tRNA合成酶催化下,利用ATP供能,在氨基酸羧基上进行活化,形成氨基酰-AMP,再与氨基酰tRNA合成酶结合形成三联复合物,此复合物再与特异的tRNA作用,将氨基酰转移到tRNA的氨基酸臂(即3'-末端CCA-OH)上(图1)。  图1 氨基酰-tRNA的生成 原核细胞中起始氨基酸活化后,还要甲酰化,形成甲酰蛋氨酸tRNA,由N10甲酰四氢叶酸提供甲酰基。而真核细胞没有此过程。 前面讲过运载同一种氨基酸的一组不同tRNA称为同功tRNA。一组同功tRNA由同一种氨酰基tRNA合成酶催化。氨基酰tRNA合成酶对tRNA和氨基酸两者具有专一性,它对氨基酸的识别特异性很高,而对tRNA识别的特异性较低。 氨基酰tRNA合成酶是如何选择正确的氨基酸和tRNA呢?按照一般原理,酶和底物的正确结合是由二者相嵌的几何形状所决定的,只有适合的氨基酸和适合的tRNA进入合成酶的相应位点,才能合成正确的氨酰基tRNA。现在已经知道合成酶与L形tRNA的内侧面结合,结合点包括接近臂,DHU臂和反密码子臂(图2)。  图2 氨基酰-tRNA合成酶与tRNA的相互作用,可见氨酸接受柄、 D柄、反密码子和可变环与酶反应 乍看起来,反密码子似乎应该与氨基酸的正确负载有关,对于某些tRNA也确实如此,然而对于大多数tRNA来说,情况并非如此,人们早就知道,当某些tRNA上的反密码子突变后,但它们所携带的氨工酸却没有改变。1988年,候稚明和Schimmel的实验证明丙氨酸tRNA酸分子的氨基酸臂上G3:U70这两个碱基发生突变时则影响到丙氨酰tRNA合成酶的正确识别,说明G3:U70是丙氨酸tRNA分子决定其本质的主要因素。tRNA分子上决定其携带氨基酸的区域叫做副密码子。一种氨基酰tRNA合成酶可以识别以一组同功tRNA,这说明它们具有共同特征。例如三种丙氨酸tRNA(tRNAAlm/CUA,tRNAAim/GGC,tRNAAin/UGC都具有G3:U70副密码子。)但没有充分的证据说明其它氨基酰tRNA合成酶也识别同功tRNA组中相同的副密码子。另外副密码子也没有固定的位置,也可能并不止一个碱基对。 (二)多肽链合成的起始 ?核蛋白体大小亚基,mRNA起始tRNA和起始因子共同参与肽链合成的起始。 1、大肠杆菌细胞翻译起始复合物形成的过程: (1)核糖体30S小亚基附着于mRNA起始信号部位:原核生物中每一个mRNA都具有其核糖体结合位点,它是位于AUG上游8-13个核苷酸处的一个短片段叫做SD序列。这段序列正好与30S小亚基中的16S rRNA3’端一部分序列互补,因此SD序列也叫做核糖体结合序列,这种互补就意味着核糖体能选择mRNA上AUG的正确位置来起始肽链的合成,该结合反应由起始因子3(IF-3)介导,另外IF-1促进IF-3与小亚基的结合,故先形成IF3-30S亚基-mRNA三元复合物。 (2)30S前起始复合物的形成:在起始因子2作用下,甲酰蛋氨酰起 始tRNA与mRNA分子中的AUG相结合,即密码子与反密码子配对,同时IF3从三元复合物中脱落,形成30S前起始复合物,即IF2-3S亚基-mRNA-fMet-tRNAfmet复合物,此步需要GTP和Mg2+参与。 (3)70S起始复合物的形成:50S亚基上述的30S前起始复合物结合,同时IF2脱落,形成70S起始复合物,即30S亚基-mRNA-50S亚基-mRNA-fMet-tRNAfmet复合物。此时fMet-tRNAfmet占据着50S亚基的肽酰位。而A位则空着有待于对应mRNA中第二个密码的相应氨基酰tRNA进入,从而进入延长阶段,以上过程见图3和图4。  图3 大肠杆菌起始复合物的形成 2、真核细胞蛋白质合成的起始 真核细胞蛋白质合成起始复合物的形成中需要更多的起始因子参与,因此起始过程也更复杂。 (1)需要特异的起始tRNA即,-tRNAfmet,并且不需要N端甲酰化。已发现的真核起始因子有近10种(eukaryote Initiation factor,eIF) (2)起始复合物形成在mRNA5’端AUG上游的帽子结构,(除某些病毒mRNA外) (3)ATP水解为ADP供给mRNA结合所需要的能量。真核细胞起始复合物的形成过程是:翻译起始也是由eIF-3结合在40S小亚基上而促进80S核糖体解离出60S大亚基开始,同时eIF-2在辅eIF-2作用下,与Met-tRNAfmet及GTP结合,再通过eIF-3及eIF-4C的作用,先结合到40S小亚基,然后再与mRNA结合。 mRNA结合到40S小亚基时,除了eIF-3参加外,还需要eIF-1、eIF-4A及eIF-4B并由ATP小解为ADP及Pi来供能,通过帽结合因子与mRNA的帽结合而转移到小亚基上。但是在mRNA5’端并未发现能与小亚基18SRNA配对的S-D序列。目前认为通过帽结合后,mRNA在小亚基上向下游移动而进行扫描,可使mRNA上的起始密码AUG在Met-tRNAfmet的反密码位置固定下来,进行翻译起始。  图4 Initiation of translation im E.cole.The initiating tRNA,tRNAMetf,is represented by the blue line,the anticodon being the horizontal short line.The fMet-tRNAMetf is delivered to the 30S subunit by IF2.NNN represents any codon (N for any nucleotie).Note.The ribosome also has an exit site not shown in the diagram.This site will be discussed later. 通过eIF-5的作用,可使结合Met-tRNAfmet·GTP及mRNAR40S小亚基与60S大亚基结合,形成80S复合物。eIF-5具有GTP酶活性,催化GTP水解为GDP及Pi,并有利于其它起始因子从40S小亚基表面脱落,从而有利于40S与60S两个亚基结合起来,最后经eIF-4D激活而成为具有活性的80SMet-tRNAfmet· mRNA起始复合物。 真核细胞翻译起始复合物的生成见图5和图6。  图5 真核细胞翻译起始复合物的形成  图6 Simplified diagram of initiation in eukaryotes.Note that several eukaryote initiation factors besides elF2 are involved .tRNAMeti,initiating RNA.e1F2 is the eukaryotic initiation factor corresponding to IF2 in prokaryotes. (三)多肽链的延长 在多肽链上每增加一个氨基酸都需要经过进位,转肽和移位三个步骤。 (1)为密码子所特定的氨基酸tRNA结合到核蛋白体的A位,称为进位。氨基酰tRNA在进位前需要有三种延长因子的作用,即,热不稳定的EF(Unstable temperature,EF)EF-Tu,热稳定的EF(stable temperature EF,EF-Ts)以及依赖GTP的转位因子。EF-Tu首先与GTP结合,然后再与氨基酰tRNA结合成三元复合物,这样的三元复合物才能进入A位。此时GTP水解成GDP,EF-Tu和GDP与结合在A位上的氨基酰tRNA分离(图7)。  图7 原核生物肽链延长因子EFTu与EFTs的作用原理  图8 肽键的形成 ①核蛋白体“给位”上携甲酰蛋氨酰 基(或肽酰)的tRNA ②核蛋白体“受体”上新进入的氨基酰tRNA; ③失去甲酰蛋氨酰基(或肽酰)后,即将从核蛋白体脱落的tRNA; ④接受甲酰蛋氨酰基(或肽酰)后已增长一个氨基酸残基的肽键 (2)转肽--肽键的形成(peptide bond formation) ?在70S起始复合物形成过程中,核糖核蛋白体的P位上已结合了起始型甲酰蛋氨酸tRNA,当进位后,P位和A位上各结合了一个氨基酰tRNA,两个氨基酸之间在核糖体转肽酶作用下,P位上的氨基酸提供α-COOH基,与A位上的氨基酸的α-NH2形成肽键,从而使P位上的氨基酸连接到A位氨基酸的氨基上,这就是转肽。转肽后,在A位上形成了一个二肽酰tRNA(图8)。 (3)移位(Translocation)  图9 Diagram of the elongation process in protein synthesis following initation.tRNAs are shown as lue lines;AA,aamicoacyl group.The positioning shown of the EF-Tu-GTP on the tRNA and on the ribosome are arbitraty .This diagram does not make evident why the ribosomal enzyme catalysing the peptide bond synthesis is called peptidyl transferase .However,if you do the next round of synthesis yourself(see text),you will see that in all subsequent rounds of synthesis it is a peptide that is transferred to the incoming aminoacyl tRNA-hence the name. ?转肽作用发生后,氨基酸都位于A位,P位上无负荷氨基酸的tRNA就此脱落,核蛋白体沿着mRNA向3’端方向移动一组密码子,使得原来结合二肽酰tRNA的A位转变成了P位,而A位空出,可以接受下一个新的氨基酰tRNA进入,移位过程需要EF-2,GTP和Mg2+的参加(图9)。 ?以后,肽链上每增加一个氨基酸残基,即重复上述进位,转肽,移位的步骤,直至所需的长度,实验证明mRNA上的信息阅读是从5’端向3’端进行,而肽链的延伸是从氮基端到羧基端。所以多肽链合成的方向是N端到C端(图10)。  图10 The elongation phase of protein synthesis on a ribosome.The three-step cycle shown is repeated over and over during the synthesos of a protein chain.An aminoacyl-tRNA moleculie binds to the A-site on the rebosome is step l,a new peptide bond is formed in sted 2,and the ribosome moves a distance of three nucleotides along the mRNA chain in step 3,ejecting an old tRNA molecule and "resetting"the ribosome so that the next aminoacyl-tRNA molecule can bind.As indicated in Figure 6-21,the p-site is drawn on the left side of the ribosome,with the A-site on the right.  图11 The final phase of protein synthesis .The binding of release factor to a stop codon terminates translation.The completed polypeptide is released,and the ribosome dissociates into two separte subunits. (四)翻译的终止及多肽链的释放 无论原核生物还是真核生物都有三种终止密码子UAG,UAA和UGA。没有一个tRNA能够与终止密码子作用,而是靠特殊的蛋白质因子促成终止作用。这类蛋白质因子叫做释放因子,原核生物有三种释放因子:RF1,RF2T RF3。RF1识别UAA和UAG,RF2识别UAA和UGA。RF3的作用还不明确。真核生物中只有一种释放因子eRF,它可以识别三种终止密码子。 不管原核生物还是真核生物,释放因子都作用于A位点,使转肽酶活性变为水介酶活性,将肽链从结合在核糖体上的tRNA的CCA末凋上水介下来,然后mRNA与核糖体分离,最后一个tRNA脱落,核糖体在IF-3作用下,解离出大、小亚基。解离后的大小亚基又重新参加新的肽链的合成,循环往复,所以多肽链在核糖体上的合成过程又称核糖体循环(ribosome cycle)(图11)。 (五)多核糖体循环 上述只是单个核糖体的翻译过程,事实上在细胞内一条mRNA链上结合着多个核糖体,甚至可多到几百个。蛋白质开始合成时,第一个核糖体在mRNA的起始部位结合,引入第一个蛋氨酸,然后核糖体向mRNA的3’端移动一定距离后,第二个核糖体又在mRNA的起始部位结合,现向前移动一定的距离后,在起始部位又结合第三个核糖体,依次下去,直至终止。两个核糖体之间有一定的长度间隔,每个核糖体都独立完成一条多肽链的合成,所以这种多核糖体可以在一条mRNA链上同时合成多条相同的多肽链,这就大大提高了翻译的效率(图12)。  图2 A polyribosome.Schematic drawing showing how a series of ribosomes can simultaneously translate the same mRNA molecule. 多聚核糖体的核糖体个数,与模板mRNA的长度有关,例如血红蛋白的多肽链mNRA编码区有450个核苷酸组成,长约150nm 。上面串连有5-6个核糖核蛋白体形成多核糖体。而肌凝蛋白的重链mRNA由5400个核苷酸组成,它由60多个核糖体构成多核糖体完成多肽链的合成。