第三章 核酸的结构和功能核酸(nucleic acid)是重要的生物大分子,它的构件分子是核苷酸(nucleotide),天然存在的核酸可分为脱氧核糖核酸(deoxyribonucleic acid,DNA)和核糖核酸(ribonucleic acid,RNA)两类。DNA贮存细胞所有的遗传信息,是物种保持进化和世代繁衍的物质基础。RNA中参与蛋白质合成的有三类:转移RNA(transfer RNA,tRNA),核糖体RNA(ribosomal RNA,rRNA)和信使RNA(messenger RNA,mRNA)。20世纪末,发现许多新的具有特殊功能的RNA,几乎涉及细胞功能的各个方面。
核苷酸核苷酸可分为核糖核苷酸和脱氧核糖核苷酸两类,核糖核苷酸是RNA的构件分子,而脱氧核糖核苷酸是DNA构件分子。细胞内还有各种游离的核苷酸和核苷酸衍生物,它们具有重要的生理功能。核苷酸由核苷(nucleoside)和磷酸组成。而核苷则由碱基(base)和戊糖构成(图3-1)。
碱基构成核苷酸中的碱基是含氮杂环化合物,有嘧啶(pyrimidine)和嘌呤(purine)两类。核酸中嘌呤碱主要是腺嘌呤和鸟嘌呤,嘧啶碱主要是胞嘧啶、胸腺嘧啶和尿嘧啶。DNA和RNA中均含有腺嘌呤、鸟嘌呤和胞嘧啶,而尿嘧啶主要存在于RNA中,胸腺嘧啶主要存在于DNA中。在某些tRNA分子中也有胸腺嘧啶,少数几种噬菌体的DNA含尿嘧啶而不是胸腺嘧啶。这五种碱基受介质pH的影响出现酮式、烯醇式互变异构体。
在DNA和RNA中,尤其是tRNA中还有一些含量甚少的碱基,称为稀有碱基(rare bases)稀有碱基种类很多,大多数是甲基化碱基。tRNA中含稀有碱基高达10%。
戊糖核酸中有两种戊糖DNA中为D-2-脱氧核糖(D-2-deoxyribose),RNA中则为D-核糖(D-ribose)(图3-5)。在核苷酸中,为了与碱基中的碳原子编号相区别核糖或脱氧核糖中碳原子标以C-1’,C-2’等。脱氧核糖与核糖两者的差别只在于脱氧核糖中与2’位碳原子连结的不是羟基而是氢,这一差别使DNA在化学上比RNA稳定得多。
核苷核苷是戊糖与碱基之间以糖苷键(glycosidic bond)相连接而成。戊糖中C-1’与嘧啶碱的N-1或者与嘌吟碱的N9相连接,戊糖与碱基间的连接键是N-C键,一般称为N-糖苷键(图3-6)。
RNA中含有稀有碱基,并且还存在异构化的核苷。如在tRNA和rRNA中含有少量假尿嘧啶核苷(用ψ表示),在它的结构中戊糖的C-1不是与尿嘧啶的N-1相连接,而是与尿嘧啶C-5相连接(图3-7)。
四、核苷酸核苷中的戊糖5’碳原子上羟基被磷酸酯化形成核苷酸。核苷酸分为核糖核苷酸与脱氧核糖核苷酸两大类。依磷酸基团的多少,有一磷酸核苷、二磷酸核苷、三磷酸核苷。(图3-8)核苷酸在体内除构成核酸外,尚有一些游离核苷酸参与物质代谢、能量代谢与代谢调节,如三磷酸腺苷(ATP)是体内重要能量载体;三磷酸尿苷参与糖原的合成;三磷酸胞苷参与磷脂的合成;环腺苷酸(cAMP)和环鸟苷酸(cGMP)作为第二信使,在信号传递过程中起重要作用;核苷酸还参与某些生物活性物质的组成:如尼克酰胺腺嘌呤二核苷酸(NAD+),尼克酰胺腺嘌呤二核苷酸磷酸(NADP+)和黄素腺嘌呤二核苷酸(FAD)。
核酸的分子结构核酸的一级结构核酸是由核苷酸聚合而成的生物大分子。组成DNA的脱氧核糖核苷酸主要是dAMP、dGMP、dCMP和dTMP,组成RNA的核糖核苷酸主要是AMP、GMP、CMP和UMP。核酸中的核苷酸以3’,5’磷酸二酯键构成无分支结构的线性分子。核酸链具有方向性,有两个末端分别是5’末端与3’末端。5’末端含磷酸基团,3’末端含羟基。核酸链内的前一个核苷酸的3’羟基和下一个核苷酸的5’磷酸形成3’,5’磷酸二酯键,故核酸中的核苷酸被称为核苷酸残基。核酸链的结构见图3-10。通常将小于50个核苷酸残基组成的核酸称为寡核苷酸(oligonucleotide),大于50个核苷酸残基称为多核苷酸(polynucleotide)。
DNA的空间结构
(一)DNA的二级结构
DNA二级结构即双螺旋结构(double helix structure)。20世纪50年代初Chargaff等人分析多种生物DNA的碱基组成发现的规则。
DNA双螺旋模型的提出不仅揭示了遗传信息稳定传递中DNA半保留复制的机制,而且是分子生物学发展的里程碑。
DNA双螺旋结构特点如下:①两条DNA互补链反向平行。②由脱氧核糖和磷酸间隔相连而成的亲水骨架在螺旋分子的外侧,而疏水的碱基对则在螺旋分子内部,碱基平面与螺旋轴垂直,螺旋旋转一周正好为10个碱基对,螺距为3.4nm,这样相邻碱基平面间隔为0.34nm并有一个36?的夹角。③DNA双螺旋的表面存在一个大沟(major groove)和一个小沟(minor groove),蛋白质分子通过这两个沟与碱基相识别。④两条DNA链依靠彼此碱基之间形成的氢键而结合在一起。根据碱基结构特征,只能形成嘌呤与嘧啶配对,即A与T相配对,形成2个氢键;G与C相配对,形成3个氢键。因此G与C之间的连接较为稳定(图3-12)。⑤DNA双螺旋结构比较稳定。维持这种稳定性主要靠碱基对之间的氢键以及碱基的堆集力(stacking force)。
生理条件下,DNA双螺旋大多以B型形式存在。右手双螺旋DNA除B型外还有A型、C型、D型、E型。此外还发现左手双螺旋Z型DNA。Z型DNA是1979年Rich等在研究人工合成的CGCGCG的晶体结构时发现的。Z-DNA的特点是两条反向平行的多核苷酸互补链组成的螺旋呈锯齿形,其表面只有一条深沟,每旋转一周是12个碱基对。研究表明在生物体内的DNA分子中确实存在Z-DNA区域,其功能可能与基因表达的调控有关(图3-13)。DNA二级结构还存在三股螺旋DNA,三股螺旋DNA中通常是一条同型寡核苷酸与寡嘧啶核苷酸-寡嘌呤核苷酸双螺旋的大沟结合,三股螺旋中的第三股可以来自分子间,也可以来自分子内(图3-14)。三股螺旋DNA存在于基因调控区和其他重要区域,因此具有重要生理意义。
(二) DNA三级结构——超螺旋结构
DNA三级结构是指DNA链进一步扭曲盘旋形成超螺旋结构。生物体内有些DNA是以双链环状DNA形式存在,如有些病毒DNA,某些噬菌体DNA,细菌染色体与细菌中质粒DNA,真核细胞中的线粒体DNA、叶绿体DNA都是环状的。环状DNA分子可以是共价闭合环,即环上没有缺口,也可以是缺口环,环上有一个或多个缺口。在DNA双螺旋结构基础上,共价闭合环DNA(covalently close circular DNA)可以进一步扭曲形成超螺旋形(super helical form)(图3-15 )。根据螺旋的方向可分为正超螺旋和负超螺旋。正超螺旋使双螺旋结构更紧密,双螺旋圈数增加,而负超螺旋可以减少双螺旋的圈数。几乎所有天然DNA中都存在负超螺旋结构。
(三) DNA的四级结构——DNA与蛋白质形成复合物在真核生物中其基因组DNA要比原核生物大得多,如原核生物大肠杆菌的DNA约为4.7×103kb,而人的基因组DNA约为3×106 kb,因此真核生物基因组DNA通常与蛋白质结合,经过多层次反复折叠,压缩近10 000倍后,以染色体形式存在于平均直径为5μm的细胞核中。线性双螺旋DNA折叠的第一层次是形成核小体(nucleosome)。犹如一串念珠,核小体由直径为11nm×5.5nm的组蛋白核心和盘绕在核心上的DNA构成。核心由组蛋白H2A、H2B、H3和H4各2分子组成,为八聚体,146 bp长的 DNA以左手螺旋盘绕在组蛋白的核心1.75圈,形成核小体的核心颗粒,各核心颗粒间有一个连接区,约有60 bp双螺旋DNA和1个分子组蛋白H1构成。平均每个核小体重复单位约占DNA 200 bp(图3-16)。DNA组装成核小体其长度约缩短7倍。在此基础上核小体又进一步盘绕折叠,最后形成染色体(图3-17)。
三、基因与基因组
(一) 基因(gene)的现代分子生物学概念是指能编码有功能的蛋白质多肽链或合成RNA所必需的全部核酸序列,是核酸分子的功能单位。一个基因通常包括编码蛋白质多肽链或RNA的编码序列,保证转录和加工所必需的调控序列和5’端、3’端非编码序列。另外在真核生物基因中还有内含子等核酸序列(图3-18)。
(二)基因组(genome)是指一个细胞或病毒所有基因及间隔序列,储存了一个物种所有的遗传信息。在病毒中通常是一个核酸分子的碱基序列,单细胞原核生物是它仅有的一条染色体的碱基序列,而多细胞真核生物是一个单倍体细胞内所有的染色体。如人单倍体细胞的23条染色体的碱基序列。多细胞真核生物起源于同一个受精卵,其每个体细胞的基因组都是相同的。
1,病毒基因组 
2.原核生物基因组 
3.真核生物基因组 
在高等真核生物中基因序列占整个基因组不到10%,大部分是非编码的间隔序列。人类基因组研究结果发现在人的基因组中与蛋白质合成有关的基因只占整个基因组2 %。真核生物基因组的最大的特点是出现分隔开的基因,在这类基因中有编码作用的序列称外显子(exon),没有编码作用的序列称内含子(intron),它们彼此间隔排列(见图3-18)。
四、各类RNA的结构绝大部分RNA分子都是线状单链,但是RNA分子的某些区域可自身回折进行碱基互补配对,形成局部双螺旋。在RNA局部双螺旋中A与U配对、G与C配对,除此以外,还存在非标准配对,如G与U配对。RNA分子中的双螺旋与A型DNA双螺旋相似,而非互补区则膨胀形成凸出(bulge)或者环(loop),这种短的双螺旋区域和环称为发夹结构(hairpin)(图3-19)。发夹结构是RNA中最普通的二级结构形式,二级结构进一步折叠形成三级结构,RNA只有在具有三级结构时才能成为有活性的分子。RNA也能与蛋白质形成核蛋白复合物,RNA的四级结构是RNA与蛋白质的相互作用。
tRNA的结构
tRNA约占总RNA的15%,tRNA主要的生理功能是在蛋白质生物合成中转运氨基酸和识别密码子,细胞内每种氨基酸都有其相应的一种或几种tRNA,因此tRNA的种类很多,在细菌中约有30~40种tRNA,在动物和植物中约有50~100种tRNA。
tRNA一级结构:
tRNA是单链分子,含73~93核苷酸,分子质量为24 000~31 000,沉降系数4S。含有10%的稀有碱基。如二氢尿嘧啶(DHU)、核糖胸腺嘧啶(rT)和假尿苷(ψ)以及不少碱基被甲基化,其3’端为CCA-OH,5’端多为pG,分子中大约30%的碱基是不变的或半不变的,也就是说它们的碱基类型是保守的。
tRNA二级结构:
tRNA二级结构为三叶草型(图3-20a)。配对碱基形成局部双螺旋而构成臂,不配对的单链部分则形成环。三叶草型结构由4臂4环组成。氨基酸臂由7对碱基组成,双螺旋区的3’末端为一个4个碱基的单链区-NCCA-OH 3’,腺苷酸残基的羟基可与氨基酸α羧基结合而携带氨基酸。二氢尿嘧啶环以含有2个稀有碱基二氢尿嘧啶(DHU)而得名,不同tRNA其大小并不恒定,在8-14个碱基之间变动,二氢尿嘧啶臂一般由3~4对碱基组成。反密码环由7个碱基组成,大小相对恒定,其中3个核苷酸组成反密码子(anticodon),在蛋白质生物合成时,可与mRNA上相应的密码子配对。反密码臂由5对碱基组成。额外环在不同tRNA分子中变化较大可在4~21个碱基之间变动,又称为可变环,其大小往往是tRNA分类的重要指标。TψC环含有7个碱基,大小相对恒定,几乎所有的tRNA在此环中都含TψC序列,TψC臂由5对碱基组成。
tRNA的三级结构:
二十世纪七十年代初科学家用X线射衍技术分析发现tRNA的三级结构为倒L形(图3-20b)。tRNA三级结构的特点是氨基酸臂与TψC臂构成L的一横,-CCAOH3’末端就在这一横的端点上,是结合氨基酸的部位,而二氢尿嘧啶臂与反密码臂及反密码环共同构成L的一竖,反密码环在一竖的端点上,能与mRNA上对应的密码子识别,二氢尿嘧啶环与TψC环在L的拐角上。形成三级结构的很多氢键与tRNA中不变的核苷酸密切有关,这就使得各种tRNA三级结构都呈倒L形的。在tRNA中碱基堆积力是稳定tRNA构型的主要因素。
(二)mRNA
原核生物中mRNA转录后一般不需加工,直接进行蛋白质翻译。mRNA转录和翻译不仅发生在同一细胞空间,而且这两个过程几乎是同时进行的。真核细胞成熟mRNA是由其前体核内不均一RNA(heterogeneous nuclear RNA,hnRNA)剪接并经修饰后才能进入细胞质中参与蛋白质合成。所以真核细胞mRNA的合成和表达发生在不同的空间和时间。mRNA的结构在原核生物中和真核生物中差别很大。下面分别作一介绍:
1,原核生物mRNA结构特点原核生物的mRNA结构简单,往往含有几个功能上相关的蛋白质的编码序列,可翻译出几种蛋白质,为多顺反子。在原核生物mRNA中编码序列之间有间隔序列,可能与核糖体的识别和结合有关。在5’端与3’端有与翻译起始和终止有关的非编码序列(图3-21),原核生物mRNA中没有修饰碱基,5’端没有帽子结构,3’端没有多聚腺苷酸的尾巴(polyadenylate tail,polyA尾巴)。原核生物的mRNA的半衰期比真核生物的要短得多,现在一般认为,转录后1min,mRNA降解就开始。
2,真核生物mRNA结构特点真核生物mRNA为单顺反子结构,即一个mRNA分子只包含一条多肽链的信息。在真核生物成熟的mRNA中5’端有m7GpppN的帽子结构(图3-22),帽子结构可保护mRNA不被核酸外切酶水解,并且能与帽结合蛋白结合识别核糖体并与之结合,与翻译起始有关。3’端有polyA尾巴,其长度为20~250个腺苷酸,其功能可能与mRNA的稳定性有关,少数成熟mRNA没有polyA尾巴,如组蛋白mRNA,它们的半衰期通常较短。
(三)rRNA的结构
rRNA占细胞总RNA的80%左右,rRNA分子为单链,局部有双螺旋区域(图3-22)具有复杂的空间结构,原核生物主要的rRNA有三种,即5S、16S和23S rRNA,如大肠杆菌的这三种rRNA分别由120、1542和2904个核苷酸组成。真核生物则有4种,即5S、5.8S、18S和28S rRNA,如小鼠,它们相应含121、158、1874和4718个核苷酸。rRNA分子作为骨架与多种核糖体蛋白(ribosomal protein)装配成核糖体。
所有生物体的核糖体都由大小不同的两个亚基所组成。原核生物核糖体为70S,由50S和30S两个大小亚基组成。30S小亚基含16S的rRNA和21种蛋白质,50S大亚基含23S和5S两种rRNA及34种蛋白质。真核生物核糖体为80S,是由60S和40S两个大小亚基组成。40S的小亚基含18S rRNA及33种蛋白质,60S大亚基则由28S、5.8S和5S 3种rRNA及49种蛋白质组成。
(四)其他RNA分子
20世纪80年代以后由于新技术不断产生,人们发现RNA有许多新的功能和新的RNA基因。细胞核内小分子RNA(small nuclear RNA,snRNA)是细胞核内核蛋白颗粒(Small nuclear ribonucleoprotein particles,snRNPs)的组成成分,参与mRNA前体的剪接以及成熟的mRNA由核内向胞浆中转运的过程。核仁小分子RNA(small nucleolar RNA,snoRNA)是类新的核酸调控分子,参与rRNA前体的加工以及核糖体亚基的装配。胞质小分子RNA(small cytosol RNA,scRNA)的种类很多,其中7S LRNA与蛋白质一起组成信号识别颗粒(signal recognition particle,SRP),SRP参与分泌性蛋白质的合成,反义RNA(antisense RNA)由于它们可以与特异的mRNA序列互补配对,阻断mRNA翻译,能调节基因表达。核酶是具有催化活性的RNA分子或RNA片段。目前在医学研究中已设计了针对病毒的致病基因mRNA的核酶,抑制其蛋白质的生物合成,为基因治疗开辟新的途径,核酶的发现也推动了生物起源的研究。微RNA(microRNA,miRNA)是一种具有茎环结构的非编码RNA,长度一般为20-24个核苷酸,在mRNA翻译过程中起到开关作用,它可以与靶mRNA结合,产生转录后基因沉默作用(post-transcriptional gene silencing,PTGS),在一定条件下能释放,这样mRNA又能翻译蛋白质,由于miRNA的表达具有阶段特异性和组织特异性,它们在基因表达调控和控制个体发育中起重要作用。
五RNA组随着基因组研究不断深入,蛋白组学研究逐渐展开,RNA的研究也取得了突破性的进展,发现了许多新的RNA分子,人们逐渐认识到DNA是携带遗传信息分子,蛋白质是执行生物学功能分子,而RNA即是信息分子,又是功能分子。人类基因组研究结果表明,在人类基因组中约有30000~40000个基因,其中与蛋白质生物合成有关的基因只占整个基因组的2%,对不编码蛋白质的98%基因组的功能有待进一步研究,为此20世纪末科学家在提出蛋白质组学后,又提出RNA组学。RNA组是研究细胞的全部RNA基因和RNA的分子结构与功能。目前RNA组的研究尚处在初级阶段,RNA组的研究将在探索生命奥秘中做出巨大贡献。
核酸的理化性质核酸的大小和测定一般来说,进化程度高的生物DNA分子应越大,能贮存更多遗传信息。但进化的复杂程度与DNA大小并不完全一致,如哺乳类动物DNA约为3×109 bp,但有些两栖类动物、南美肺鱼DNA大小可达1010bp到1011bp(表3-3)。
常用测定DNA分子大小的方法有电泳法、离心法。凝胶电泳是当前研究核酸的最常用方法,凝胶电泳有琼脂糖(agarose)凝胶电泳和聚丙烯酰胺(polyacrylamide)凝胶电泳,
二、核酸的水解
DNA和RNA中的糖苷键与磷酸酯键都能用化学法和酶法水解。在很低pH条件下DNA和RNA都会发生磷酸二酯键水解。并且碱基和核糖之间的糖苷键更易被水解,其中嘌呤碱的糖苷键比嘧啶碱的糖苷键对酸更不稳定。在高pH时,RNA的磷酸酯键易被水解,而DNA的磷酸酯键不易被水解。
水解核酸的酶有很多种,若按底物专一性分类,作用于RNA的称为核糖核酸酶(ribonuclease,RNase),作用于DNA的则称为脱氧核糖核酸酶(deoxyribonuclease,DNase)。按对底物作用方式分类,可分核酸内切酶(endonuclease)与核酸外切酶(exonuclease)。核酸内切酶的作用是在多核苷酸内部的3’,5’磷酸二酯键,有些内切酶能识别DNA双链上特异序列并水解有关的3’,5’磷酸二酯键。核酸内切酶是非常重要的工具酶,在基因工程中有广泛用途。而核酸外切酶只对核酸末端的3’,5’磷酸二酯键有作用,将核苷酸一个一个切下,可分为5’→3’外切酶,与3’→5’外切酶。
三、核酸的变性、复性和杂交变性在一定理化因素作用下,核酸双螺旋等空间结构中碱基之间的氢键断裂,变成单链的现象称为变性(denaturation)。引起核酸变性的常见理化因素有加热、酸、碱、尿素和甲酰胺等。在变性过程中,核酸的空间构象被破坏,理化性质发生改变。由于双螺旋分子内部的碱基暴露,其A260值会大大增加。A260值的增加与解链程度有一定比例关系,这种关系称为增色效应(hyperchromic effect)(图3-24)。如果缓慢加热DNA溶液,并在不同温度测定其A260值,可得到,S”形DNA熔化曲线(melting curve)(图3-25a)。从DNA熔化曲线可见DNA变性作用是在一个相当窄的温度内完成的。
当A260值开始上升前DNA是双螺旋结构,在上升区域分子中的部分碱基对开始断裂,其数值随温度的升高而增加,在上部平坦的初始部分尚有少量碱基对使两条链还结合在一起,这种状态一直维持到临界温度,此时DNA分子最后一个碱基对断开,两条互补链彻底分离。通常把加热变性时DNA溶液A260升高达到最大值一半时的温度称为该DNA的熔解温度(melting temperature Tm),Tm是研究核酸变性很有用的参数。Tm一般在85~95℃之间,Tm值与DNA分子中G C含量成正比。
复性变性DNA在适当条件下,可使两条分开的单链重新形成双螺旋DNA的过程称为复性(renaturation)。当热变性的DNA经缓慢冷却后复性称为退火(annealing)(图3-26)。DNA复性是非常复杂的过程,影响DNA复性速度的因素很多:DNA浓度高,复性快;DNA分子大复性慢;高温会使DNA变性,而温度过低可使误配对不能分离等等。最佳的复性温度为Tm减去25℃,一般在60℃左右。离子强度一般在0.4mol/L以上。
杂交具有互补序列的不同来源的单链核酸分子,按碱基配对原则结合在一起称为杂交(hybridization)。杂交可发生在DNA-DNA、RNA-RNA和DNA-RNA之间。杂交是分子生物学研究中常用的技术之一,利用它可以分析基因组织的结构,定位和基因表达等,常用的杂交方法有Southern印迹法,Northern印迹法和原位杂交(insitu hybridization)等。