第十二章 DNA的复制、修复与重组DNA技术
DNA是储存遗传信息的物质,亲代的遗传信息如何真实地传给子代,这个问题的实质就是DNA分子如何复制(replication)成完全相同的两个拷贝,即DNA的合成,可见通过复制,遗传信息得以在传代中保留。
DNA分子中的遗传信息又如何表达呢?现知基因表达的第一步是通过转录(transcription),即DNA的碱基按互补配对(G-C,A-T,A-U)的原则转变为RNA分子上相应的碱基序列,接着RNA通过翻译(translation),以三个碱基的序列作为一个氨基酸的遗传密码,从而决定蛋白质的一级结构。不同基因编码不同结构的蛋白质,表现出不同的功能,因而体现出多种多样的生命现象。遗传信息从DNA经RNA流向蛋白质的过程,是Crick于1958年提出的,称为分子生物学的中心法则(central dogma)(图12-1)。1970年Temin提出“逆向转录”(reverse transcription)扩充了中心法则的范围。
基因或DNA是遗传信息的携带者,在细胞分裂过程中,亲代细胞所含的遗传信息,完整地传递到两个子代细胞。这个过程的实质问题是DNA分子如何复制成完全相同的两个拷贝,有许多酶和蛋白质参与复制过程,通过正确和完整的复制,亲代DNA的遗传信息真实地传给子代,这是遗传信息一代一代传递下去的分子基础,这也是本章的重点内容。但生物体内外环境存在着使DNA分子损伤的因素,因此机体还必须有一套DNA修复的机制。最后还将介绍一些有关重组DNA技术的概念和方法。
第一节 DNA复制的几个基本原则一、半保留复制
Watson和Crick于1953年提出的DNA双螺旋模型,碱基互补配对的原则,为DNA分子的复制提供了理论基础,即亲代的DNA双链,每股链都可以作为模板,按碱基互补配对原则指导DNA新链的合成,这样合成的两个子代DNA分子,碱基序列与亲代分子完全一样。但一条链是来自亲代的DNA链,另一条链是新合成的链,此即为半保留复制 (semiconservative replication)。用15N标记亲代的DNA链,而用14N标记新合成的DNA链的实验,证实子代的DNA分子,一股链含15N,另一股含14N。
二、半不连续复制
DNA双螺旋的两股链是反向平行(antiparallel)的,新合成的两股子链,一股的方向为5′→3′,另一股为3′→5′。那么体内是否存在两种DNA聚合酶?一种催化核苷酸以5′→3′方向聚合,另一种以3′→5′方向聚合。但从现知所有的DNA聚合酶都只能催化5′→3′方向合成。这个问题直到1968年冈崎(Okazaki)发现大肠杆菌DNA复 制过程中出现一些含1000 ~2000个核苷酸的片段,一旦合成终止,这些片段即连成一条长链。这种小片段被称为冈崎片段(Okazaki fragment)。因此,复制时亲代DNA分子中那股3′→5′方向的母链作为模板,指导新链以5′→3′方向连续合成,此链称为前导链(1eading strand)。在前导链延长1000 ~2000个核苷酸后,另一母链也作为模板指导新链也是沿5′→3′合成1 000 ~2 000个核苷酸的小片段,这就是冈崎片段。随着链的延长,可以有许多个冈崎片段,这条称为随从链(1agging strand)。可见,随从链为不连续复制,所以DNA为半不连续复制(semi-discontinuous replication),如图12-2所示。复制后,这些冈崎片段由DNA连接酶的作用而连接成完整的新链。
三、RNA引物目前所发现的DNA聚合酶都需要一个具3′-OH的引物,才能将合成原料dNTP一个一个接上去。因为DNA聚合酶不能催化两个游离的dNTP在DNA模板上进行聚合,如图12-3所示。实验又发现抑制RNA聚合酶的药物如利福霉素(rifampicin)能抑制DNA的复制。再者在体外DNA复制实验中发现冈崎片段的5′端都有一小段4~12个核苷酸的RNA引物(RNA primer)。现知RNA聚合酶合成新链时不需要引物,能直接催化游离NTP聚合。可见RNA引物为DNA聚合酶提供聚合新核苷酸所需的3′-OH。RNA引物最后被DNA聚合酶Ⅰ除去,留下的空隙也由该酶补满,缺口再由DNA连接酶封口。
在DNA的复制需要RNA引物呢,除了DNA聚合酶不能催化两个游离dNTP的聚合,而RNA引物酶却具有此能力外,这种作用尚可尽量减少DNA复制起始处的突变。因为游离核苷酸起始处的聚合最容易出现差错,若用RNA引物,即使出现差错,由于最后将被DNA聚合酶Ⅰ切除,便可提高DNA复制的真实性。
四、复制的真实性
DNA复制过程是非常复杂的,需要许多酶类和蛋白质因子参加。这既保证DNA复制的速度,又保证产物的高度真实性。这也保证了自然界种族延续中生物遗传特性的相对稳定性。
第二节 参与DNA复制的一些酶类和蛋白质大肠杆菌的DNA聚合酶
DNA聚合酶(DNA polymerase)的作用是将脱氧核苷酸连接成DNA,所用底物必须是四种脱氧核苷三磷酸(dNTP ),Mg2+存在和一个DNA模板,按模板的序列将配对的脱氧核苷酸逐个接上去,并且需要一个具有3′-OH的RNA引物或DNA的3′-OH端。使3′-OH与合成上去的dNTP分子α-磷酸连接成3′,5′磷酸二酯键,合成方向为5′→3′,如图12-4。
从大肠杆菌纯化得到3种DNA聚合酶(Ⅰ,Ⅱ,Ⅲ )。
(一) DNA聚合酶Ⅰ
1955年Kornberg发现了DNA聚合酶Ⅰ(简称为polⅠ),故也称为Kornberg酶,并因此而获得诺贝尔奖金。DNA聚合酶Ⅰ是一条分子质量为103X103 Da的多肽链。具有多种催化功能。若用蛋白酶轻度水解可得一个分子质量68X103 Da的大片段和一个分子质量为36X103 Da的小片段,常将大片段称为Klenow片段,此片段具有两种催化活性,一为上述的聚合功能,另一为3′→5′外切酶的活性,从3′端水解DNA产生3′单核苷酸,如图12-5所示。
这种3′→5′外切酶活性对保证DNA复制的真实性具有重要的意义。DNA聚合酶在接上新的核苷酸前,它能对3′末端的碱基进行识别。若为配错的碱基,即通过3′→5′外切酶活性把配错的碱基切除,再使正确的碱基聚合上去,保证DNA复制的高度真实性,这种功能也称校读功能(proof reading)。小片段则具5′→3′外切酶的活性,它能从5′→3′方向一个挨一个切除,产物为5′单核苷酸,或跨过若干个核苷酸再进行酶解,从5′末端释放一寡核苷酸。可除去冈崎片段5′端的RNA引物和在DNA损伤修复中起重要的作用。可见,DNA聚合酶Ⅰ为一条多肽链上具有三种酶的活性,也是一种多功能酶(图12-7)。
但DNA聚合酶Ⅰ并不是大肠杆菌DNA复制中主要的DNA合成酶,它的主要作用,是切除RNA引物、填补空缺和DNA损伤的修复。
DNA聚合酶Ⅰ为一条多肽链上具有三种酶的活性,是一种多功能酶(图12-7)。
鉴于Klenow片段兼具聚合及3′→5′外切活性,能非常准确按模板碱基序列合成DNA,所以此片段是分子生物学常用的工具酶。
(二) DNA聚合酶Ⅱ
由一条多肽链构成。此酶除具有聚合酶的活性外,还具有3′→5′外切酶活性。它在生物体内的确切作用不详,可能也是在DNA损伤修复中起作用。
(三) DNA聚合酶Ⅲ
此酶是一个多聚酶,由10种不同亚基组成的( 图12- 8),称为DNA聚合酶Ⅲ全酶(DNA po1ymerase Ⅲ ho1oenzyme)。它具有三个特点:①是一种非常高的续进性(processivity)酶。所谓续进性即在DNA聚合酶与模板分离下来之前加入的核苷酸平均数。续进性≧500 000。而DNA聚合酶Ⅰ仅合成3~200个核苷酸即自模板上释放。②DNA聚合酶Ⅲ催化活性比DNA聚合酶Ⅰ高很多倍,每秒可催化1 000个核苷酸的聚合,而DNA聚合酶Ⅰ每秒仅催化16~20个核苷酸聚合。③DNA聚合酶Ⅲ不但催化活性大、合成速度快,而且由于具有3′→5′外切酶活性,产物真实性高。所以,大肠杆菌DNA聚合酶Ⅲ是DNA复制必需的酶。
DNA聚合酶Ⅲ聚合和校正功能分别存在于α和ε亚基。
DNA聚合酶Ⅲ全酶分子质量约900X103 Da,全酶成不对称的二聚体,围绕着DNA双螺旋,每个单体都具有催化活性,一个作用于前导链,另一个作用于随从链,使DNA两股链在同一位置同一时间进行合成。
二、真核细胞的DNA聚合酶真核细胞的DNA聚合酶有5种,即DNA聚合酶α、β、γ、δ和ε。DNA聚合酶α负责随从链的合成,DNA聚合酶δ和增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)负责前导链的合成。PCNA是作为DNA聚合酶δ活性所需的一种辅助蛋白,有与E.coli DNA聚合酶Ⅲ的β亚基类似的结构和功能,形成环状的夹钳,大大地增强DNA聚合酶δ的续进性。DNA聚合酶γ负责线粒体DNA(mitochondria DNA,mt DNA)的复制,DNA聚合酶β和ε的功能为DNA的修复。
三、解旋、解链酶类复制时DNA双螺旋要解开,才能在原来的母链上合成新链。复制在不断延伸,螺旋要不断解开。若每秒钟复制1 000个碱基对,则要解旋100次。这样必然在复制前方产生很大的张力,使DNA缠结,这要靠DNA拓扑异构酶等来解决。
(一) DNA解链酶
DNA复制时,复制开始部位的DNA双螺旋必须解开成单链,模板链上的碱基才能以碱基配对原则,指导新链的合成。解开DNA双螺旋的酶有多种,称为DNA解链酶(DNA helicase),该酶具有ATP酶的活性,在ATP的存在下,该酶能解开DNA双链,每解开1对碱基消耗2个ATP。
(二) 单链DNA结合蛋白单链DNA结合蛋白(single strand binding protein,SSB)或螺旋去稳定蛋白(helix destabilizing protein HDP),能与已被解链酶解开的单链DNA结合,以维持模板处于单链状态,又可保护其不被核酸酶水解。单链DNA结合SSB后既可避免重新形成双链的倾向,又可避免自身发夹螺旋的形成,还能使前端双螺旋的稳定性降低,易被解开。当DNA聚合酶在模板上前进,逐个接上脱氧核苷酸时,SSB即不断脱离,又不断与新解开的链结合。
(三) DNA拓扑异构酶拓扑一词是指物体作弹性移位而又保持物体不变的性质。DNA拓扑异构酶(topoiso-
merase)有两类:其中拓扑异构酶Ⅰ,曾有过多种其他名称如转轴酶、解缠酶等。它能切断DNA双链中的一股,使DNA解链旋转时不致缠结,解除张力后又把切口封闭。拓扑异构酶Ⅱ,又称旋转酶(gyrase),暂时切断DNA双链,使另一DNA双链经过此切口,随后又再封闭切口。
四、引发体引发体(primosome)是由多种蛋白质及酶组成,是DNA复制开始所必需的。引发体中的某些蛋白质如DnaA能结合至DNA复制起始部位,DnaB具有解链酶的作用,DnaC辅助DnaB结合到复制起始点,使起始部位的双链解开。而引发体中的引物酶(primase)在已解开起始部位的DNA单链按碱基互补配对催化NTP聚合,合成一小片段的RNA,作为DNA合成的引物,即沿此引物RNA的3′-OH进行延伸。
五、DNA连接酶
DNA连接酶(DNA 1igase)催化两段DNA链之间磷酸二酯键的形成。要求DNA链
3′端有游离的OH,而5′端带有磷酸根,连接过程需要ATP供能,如图12-9。
DNA连接酶不能连接两分子单链的DNA,只能作用双链DNA分子中一股链上的缺口,或双链DNA分子双股的缺口。如DNA经限制性内切核酸酶切割后,两个片段的粘性末端相配,DNA连接酶能使之连接。即使是两段平齐DNA,DNA连接酶也能使之连接。在DNA复制过程中,当RNA引物清除后,靠DNA聚合酶Ⅰ填补空缺,冈崎片段之间的缺口靠DNA连接酶作用而连成完整的一条新链。DNA连接酶在DNA损伤修复中亦起重要作用,并且是一种重要的工具酶。
第三节 DNA复制过程一、复制的起始大肠杆菌复制时有特定的起始部位称为oriC,长度为245bp。有3个串连排列的核苷酸序列,每个由13个核苷酸组成。其序列基本相同为GATCTNTTNTTTT,而且GATC在oriC部位出现11次,oriC还有4个DnaA结合位点,是4个 9bp序列的反向重复,这些序列都是高度保守的(图12-10。)
DnaA先结合至复制起始点,然后发动了复杂的变化。DnaB和DnaC亦参加进去,从而使双链解开,DNA结合蛋白便与单链DNA结合。接着引物酶按碱基配对原则合成一小段的RNA引物,此引物的3′-OH可供DNA聚合酶Ⅲ将第一个dNTP加到3′-OH上而形成3′,5′磷酸二酯键。复制是从oriC开始,同时向两个方向进行的,称为双向复制(bi-directional replication)。
复制开始后由于DNA双链解开,在两股单链上进行复制。在电子显微镜下观察DNA
复制前进部位伸展成叉状,称为复制叉(replication fork),如图12-12。
复制的延长在DNA聚合酶Ⅲ的作用下,新合成的DNA链不断延长。大肠杆菌的冈崎片段长度为1 000~2 000个核苷酸,即前导链合成1 000~2 000个核苷酸后,随从链便开始合成。在延长过程中,由于拓扑异构酶的作用,避免了在复制叉前方的DNA打结。
三、复制的终止在DNA延长阶段结束后,原核生物的RNA引物被DNA聚合酶Ⅰ切除。留下的空隙,由DNA聚合酶Ⅰ进行补满,即从另一冈崎片段的3′-OH按5′→3′根据碱基配对原则,将一个个的dNTP补上去。最后的缺口再由DNA连接酶将相邻的两个核苷酸借磷酸二酯键连起来,即成完整的一条新链,DNA的复制即告完成,如图12-15。
四、真核生物端粒DNA的复制真核生物线性染色体的两个末端称为端粒(telomere)。按上述DNA复制机制新合成子链5′端的那段RNA引物被切除后,必留下一个空缺,假如每次细胞分裂或DNA复制都是如此,端粒将会不断缩短,最终导致关键基因的丧失及种系灭绝的危险,但事实并非如此。那么真核生物一定存在着某种阻止端粒缩短的机制。
(一) 端粒DNA的结构和端粒酶对端粒DNA序列的分析,发现端粒DNA的3′端是由数百个串联重复GT丰富的短的寡核苷酸序列,如四膜虫的重复序列为-GGGGTT-,人为-AGGGTT-。端粒DNA序列虽不含功能基因,但对维持染色体的稳定性起着重要作用。如果端粒丧失,染色体之间可能出现端-端融合、降解、重排乃至染色体丢失等变化,最后细胞衰亡。
近年来,发现了一种能防止端粒缩短的酶,称为端粒酶(telomerase),该酶由蛋白质和RNA两部分组成,其中RNA作为合成端粒DNA的模板,端粒酶是目前所知唯一携带RNA模板的逆转录酶,具有种属特异性,例如四膜虫的端粒酶,其RNA部分含159个核苷酸,其中有一段序列为5′-CAACCCCAA-3′可作为合成端粒DNA3′端GT 丰富序列-GGGGTT-模板。人端粒酶的RNA含450个碱基,其中-CUAACCCUAAC-为合成-AGGGTT-的模板。这样可防止细胞分裂时DNA复制端粒的缩短。
端粒、端粒酶和细胞的衰老有密切关系。有人将端粒称为分子钟或有丝分裂钟。但是恶性肿瘤细胞当端粒缩短到某种程度,端粒酶活性又重新出现,对端粒进行补偿,使之永不衰亡,形成恶性增殖。
(二) 端粒酶的作用机制第四节 DNA的损伤与修复
DNA是储存遗传信息的物质。从生物遗传角度来讲,要求在复制过程中保持遗传密码的稳定性,物种才能得以延续。哺乳动物单倍体细胞的基因组由2.9X109 bp DNA组成。动物一生中,从受精卵细胞到个体死亡,这些遗传密码要经过千万次的复制。在物种进化的长河中,DNA复制的次数更是难以计数,而且生物体内外环境都存在着使DNA损伤(DNA damage)的因素。可见,除DNA复制的高度真实性外,还要求某种修复DNA损伤的机制。每一遗传信息都以不同拷贝储存在DNA两条互补链上。因此,若一条链有损伤,可被修复酶切除,并以未损伤的信息重新合成与原来相同的序列,这就是DNA修复(DNA repair)的基础。
但是在漫长的进化过程中,DNA的序列还是会发生改变,通过复制传递给子代成为永久的,这种DNA的核苷酸序列永久的改变称为突变(mutation)。若发生的突变有利于生物的生存则保留下来,这就是进化;若不适应于自然选择(nature selection)则被淘汰,因此生物的进化可以看成是一种主动的基因改变过程,这是物种多样性的原动力。所以,生物的变异是绝对的,修复是相对的。
一、造成DNA损伤的因素造成DNA损伤的因素有生物体内自发的、亦有外界物理和化学等因素。
(一) 自发的因素由于DNA分子受到周围环境溶剂分子的随机热碰撞(thermal collision),腺嘌呤或鸟嘌呤与脱氧核糖间的N-糖苷键可以断裂,使A或G脱落。人体细胞中DNA每天每个细胞要脱落5 000个嘌呤碱,每天每个细胞也有100个胞嘧啶自发脱氨而成尿嘧啶。
(二) 物理因素
1.紫外线损伤 由于嘌呤环与嘧啶环都含有共轭双键,能吸收紫外线而引起损伤。嘧啶碱引起的损伤比嘌呤碱大10倍。损伤是由于嘧啶二聚体的产生,即2个相邻嘧啶碱的C5和C6共价交联,如图12-18所示。
2.电离辐射损伤 如X射线和γ射线,可以是辐射能量直接对DNA的影响,或DNA周围的溶剂分子吸收了辐射能,再对DNA产生损伤作用。如碱基的破坏、单链的断裂、双链的断裂、分子间的交联、碱基脱落或核糖的破坏等。
(三) 化学因素二、DNA损伤的类型根据DNA分子的改变,可把突变分为下面几种主要类型。
点突变点突变(point mutation)是DNA分子上一个碱基的变异,可分为:①转换(transition)同型碱基,如一种嘌呤代替另一种嘌呤或一种嘧啶代替另一嘧啶。②颠换(transversation)异型碱基,即嘌呤变嘧啶,或嘧啶变嘌呤。点突变可根据发生在DNA分子的部位,如发生在启动子或剪接信号部位可以影响整个基因的功能;若发生在编码序列,有的可以改变蛋白质的功能如引起镰状红细胞贫血;有的则为中性变化,即编码氨基酸虽变化,但功能不受影响;有的甚至是静止突变,碱基虽变但编码氨基酸种类不变。
缺失
缺失(deletion)是一个碱基或一段核苷酸链乃至整个基因,从DNA大分子上丢失。如有些地中海贫血、生长激素基因缺失,再如上述Lesch- Nyhan综合征是HGPRT基因缺失。
(三)插入
插入(insertion)是一个原来没有的碱基或一段原来没有的核苷酸序列插入到DNA大分子中去,或有些芳香族分子如吖啶(acridine)嵌入DNA双螺旋碱基对中,可以引起移码突变(frame-shift-mutation),影响三联体密码的阅读方式。
(四)倒位
DNA链内部重组,使其一段方向颠倒。
三、修复机制光修复机制这种机制主要存在于低等生物。
1,不需要光复活酶
光复活酶(photoreactivating enzyme)也称为DNA光修复酶(photolyase)。当280nm紫外线照射DNA产生的嘧啶二聚体,在短波239nm照射下,二聚体即分解成单体。
2,需要光复活酶 紫外线照射使光复活酶激活,能解聚嘧啶二聚体。
切除修复因不需要光照射,故也称暗修复。DNA引起大的损伤,包括UV引起的嘧啶二聚体、嘧啶/ 环丁烷二聚体、几个其它类型的碱基加合物、通过曝露于香烟的烟尘在DNA中形成的苯并芘尿嘧啶。一般由切除修复(excision repair)系统修复。该修复途径对所有生物的生存是关键的。在大肠杆菌E.coli中,有一种UV特异的切割酶(excinuclease或UVrABC enzyme),能识别UV照过产生的二聚体部位。并在远离损伤部位5′端8个核苷酸处及3′端4个核苷酸处各作一切口。像外科手术“扩创”一样,将含损伤的一段DNA切掉。DNA聚合酶Ⅰ进入此缝隙,从3′-OH开始,按碱基配对原则以另一条完好链为模板进行修复。最后由DNA连接酶将新合成的DNA片段与原来DNA链连接而封口 (图12-19) 。真核细胞的切割核酸酶的作用和机制,是与细菌的酶完全类似的方式对嘧啶二聚体切割。切除修复是人体细胞 的重要修复形式,有些遗传性疾病如着色性干皮病(xeroderma pigmentosum),是常染色体隐性遗传性疾病。纯合子患者的皮肤对阳光或紫外线极度敏感,皮肤变干、真皮萎缩、角化、眼睑结疤、角膜溃疡,易患皮肤癌。此病是由于缺乏UV特异内切核酸酶造成的。
(三) 碱基切除修复每个细胞都有一类DNA糖苷酶(DNA glycosylase),每一种酶能识别一种DNA分子中改变的碱基,能水解该改变的碱基与脱氧核糖间的糖苷键,使改变的碱基脱落,在DNA上产生一个缺嘌呤或缺嘧啶的位(apurinic-or apyrimidinic-site,AP site),再藉切除修复机制进行修复。现知至少有20种不同的DNA糖苷酶,各具特异性。如识别胞嘧啶脱氨生成的尿嘧啶,腺嘌呤脱氨基产物,开环的碱基,不同烷基化类型的碱基等。如胞嘧啶脱氨后即成尿嘧啶,若不纠正,可引起类型转换,即G-C→A-T。
碱基切除修复(base-excision repair)步骤如下:
1) DNA糖苷酶识别损伤的碱基,在碱基和脱氧核糖之间切割。
2) AP核酸内切酶切AP位置附近的磷酸二酯键。
3) DNA聚合酶Ⅰ用它的5′→3′外切酶活性除去损伤链,从缺口的3′-OH起始修复合成,用新合成的DNA替代。
4)最后缺口由DNA连接酶封口(图12-20)。
尿嘧啶DNA糖苷酶修复的发现,解答了一个长年以来的疑题,即组成RNA是U,而组成DNA却是甲基化为T,即从UMP→dTMP,要消耗能量。但U和T都与A互补配对,所编的密码是相同的。生物体为什么花如此代价? 现在问题清楚了,尿嘧啶-DNA糖苷酶只能切除DNA链上的尿嘧啶,而不能切除DNA链上的胸腺嘧啶,因为后者C5有一甲基,好像是给尿嘧啶加上一个标签。胞嘧啶脱氨基后形成的尿嘧啶即无此标签,即被该糖苷酶识别为改变了的碱基。若DNA与RNA一样也用尿嘧啶,那么胞嘧啶脱氨形成尿嘧啶,与正常部位的尿嘧啶便无法区别,不能纠正,造成子代DNA的突变即GC→AT。可见DNA由T代替U,能增加遗传信息的稳定性。相反,RNA不需修复,拷贝数很多,半衰期短,即使有个拷贝的胞嘧啶脱氨基转变为U,影响也不大,合成出来的绝大多数蛋白质还是具有正常生理功能,而且U作为合成原料经济得多。
第五节 重组DNA技术
DNA重组(recombination of DNA)是自然界常见现象,指的是在两个DNA分子之间,或一个DNA分子的两个不同部位之间通过链断裂和片段的交换重接,改变了基因的组合序列。这种交换可发生于同一细胞内或细胞间,甚至不同物种的DNA。DNA重组现象广泛存在于真核细胞、原核细胞乃至病毒和质粒。
本节所要介绍的重组DNA技术或基因工程(genetic engineering),是70年代由Stanford大学Boyer、Cohen和Berg等科学家建立的一种革命性的技术方法,它是在实验室内用人工方法将不同来源,包括不同种属生物的DNA片段,拼接成一个重组DNA(recombinant DNA)分子,将其引入活细胞内,使其大量复制或表达。这种技术方法称为重组DNA技术。由于它可以把一个生物体中携带的某一特定的遗传信息(基因),通过一定的方法转移到另一生物体中,使之获得前者的遗传特征,创造新的遗传组合,所以又称为基因工程,若从遗传角度来考虑也可称为遗传工程。重组DNA技术中所含有的目的DNA分子或基因需进行无性繁殖、扩增成为一个克隆(clone),因此基因工程在不同的场合又可有不同的名称,如分子克隆(molecular cloning)、DNA克隆、基因克隆等。
一、基因工程的基本步骤基因工程可分为三个过程。
重组DNA分子的构建即将一目的DNA序列或基因共价连接于一个DNA载体上构成一个重组DNA分子。
引入宿主细胞用转化、感染或转染等方法使重组DNA分子进入宿主细胞,如细菌、酵母、动物细胞。
筛选挑选含有重组DNA分子的细胞,使之克隆化并加以鉴定,可大量扩增或表达。
二、重组DNA分子的构建重组DNA分子的构建需要下面几个方面的条件与方法。
目的基因或DNA片段所要研究的某一基因或某段DNA序列有下列来源:
1.基因组DNA(genomic DNA)
2.cDNA 可以是先分离某一特殊mRNA,这些mRNA在逆转录酶催化下合成单股互补DNA(complementary DNA,cDNA),再由DNA聚合酶合成双股cDNA,供构建用。
若将某种细胞中所有mRNA都抽提出来,并制备成各自相应的cDNA。此包含某特定细胞的全部cDNA克隆即为cDNA文库(cDNA library),由此建立的文库,包括了这种细胞所有表达的基因的序列。与基因组文库不同点为cDNA不含内含子成分,也不含不转录的序列。cDNA文库中所含cDNA的情况也因不同组织细胞和不同发育阶段及不同生理状态而不同。
3.人工合成的DNA片段
4.聚合酶链反应(PCR)扩增DNA片段或cDNA
以已有DNA为模板,通过PCR扩增出所需片段。另可以mRNA为模板,采用逆转录酶PCR进行扩增,得到所需要的cDNA。(详见下节)。
(二) 载体欲将外源基因或DNA片段导入宿主细胞进行扩增或表达,需要通过一个能在宿主细胞中进行自我复制并表达目的基因的载体(vector)的介导,目的DNA与载体在体外构成重组DNA分子,然后导入宿主细胞,进行扩增及表达。以大肠杆菌作为宿主细胞的载体有:质粒、λ噬菌体、粘粒和M13噬菌体等。这些载体分为克隆用和表达用不同种类,有些还含有在真核细胞中生活及基因表达必须的成分,供不同实验目的选用,多数已作为商品供应。
1,克隆载体 (vector of clone)
(1) 质粒 质粒(plasmid)是细菌染色体外小的双链闭环的DNA分子,能自主复制,并含有抗药性基因。
较理想的质粒应符合下列条件:
1) 要有多个单切口的限制性内切酶的位点,而且外源DNA片段插入后,不影响质粒的复制。
2) 含有抗药性或其他可供筛选的标志,外源DNA插入后,抗药性消失,或其他酶活性丧失。
3) 含有高效的自主复制序列,这样在宿主细胞中质粒复制的拷贝数多。若含有能在真核细胞生活的序列,这种载体则能在真核细胞中生活及表达。pBR322是一种最常用、最基础的质粒。通过人工构建而成,其结构如图12-22所示。大小:4363bp抗药性基因:有两个。氨苄青霉素抗性 (ampicillin resistance,ampR)基因编码β-内酰胺酶(β-1actamase),能切开氨苄青霉素的内酰胺环,从而使之失效。若在此基因中插入外源DNA片段,即破坏该酶的结构。另一四环素抗性(tetracycline resistance,ampR)基因,编码一种蛋白质,能改变细菌膜的状态,阻止四环素进入细胞而赋予宿主抗四环素的能力。若该基因被外源DNA插入即失活。 自主复制(ori)成分(序列),使pBR322在大肠杆菌内能高效进行复制,产生多拷贝。
另一些质粒如pUC系统,除含ampr基因外,还含大肠杆菌的lacZ基因也常被用作为选择的标记。此基因编码β半乳糖苷酶。LacZ位于多位点接头(polylinker)上。有的还含有高效的启动子。
(2) λ噬菌体 λ噬菌体 (bacteriophage λ)为线状双链DNA病毒(约50kb),感染大肠杆菌。经改造的噬菌体有一、二个EcoRⅠ切点,并含有LacZ基因作为筛选的标志。当中的1/3序列不是病毒生活所必需,可以去除,而由外源DNA片段(5~25kb)替代。如图12-23所示。
β-半乳糖苷酶能分解一种化学品称为5-溴-4-氯-3吲哚-半乳糖苷(5-bromo-4-chloro
-3-indolyl-galactoside,X-gal),X即为5-bromo-4-chloro-3-indolyl,是一发色(蓝色)基团,当它与半乳糖以糖苷键结合时即为无色。但是X-gal经β-半乳糖苷酶作用后即将X基团释放出来而成蓝色。若LacZ被插入的DNA片段破坏,则不能产生β-半乳糖苷酶,因此在含有X-gal的培养基中成为无色的斑点。若LacZ完整,X-gal被β-半乳糖苷酶分解而成为蓝色的斑点,故可作为筛选的标志。
(3) 其他
2,表达载体(expression vector)
表达载体是带有调控克隆基因表达必需的转录和翻译信号的克隆载体。克隆基因在细菌和其它细胞中的过量表达,能够产生大量的特异蛋白质。
(1)大肠杆菌表达载体 大肠杆菌表达载体(E.coli expression vector)除具有克隆载体所具备的性质以外,还带有控制在大肠杆菌中表达元件即转录和翻译所必需的DNA序列?,启动子、操纵基因、编码阻遏物的基因、核糖体结合位点、转录终止信号。
(2)真核表达载体 真核表达载体(eukaryotic expression vector)含有必不可少的原核序列,如在大肠杆菌中能够作用的复制子,便于挑选带重组质粒细菌的抗生素抗性基因。但在质粒中还包括在真核细胞中生活和表达元件:启动子/ 增强子、克隆位点、终止信号和加poly(A) 信号、剪接供体和受体、复制起始点和选择标记基因。
(三) 工具酶限制性内切酶(restriction enzyme或restriction endonuclease),DNA连接酶、末端脱氧核苷酸转移酶(terminal deoxynucleotidyl transferase,TdT)、逆转录酶、S1核酸酶(切单链DNA或RNA)、碱性磷酸酶等均属工具酶。限制性内切酶是重组DNA技术中最关键的工具酶,现着重加以介绍。
限制性内切酶是微生物的一种自我保护的酶,它能识别双链DNA分子中特异碱基序列并切开。所以当外源DNA侵入细菌体时,细菌体为保护自身DNA的完整性,通过其所含的特有的限制性内切酶对外源DNA进行酶解,而自身的DNA分子中所含该限制性内切酶的识别碱基序列则被另一种酶进行甲基化而保护起来,故不被自己的限制性内切酶所切断。
限制性内切酶识别的DNA序列多数为4~6个碱基,新近发现一些能识别8个碱基的。识别碱基数少的酶对DNA切的机率多,碱基数大则少。所以识别8个碱基序列的酶,可用于分析大片段DNA,可切成上百乃至上千kb的片段。限制性内切酶的识别序列都具有回文或双重对称结构的特点。
切口:有两种切口。一种切开后,即成黏性末端(cohesive ends或sticky ends),因为两个末端的碱基互补配对,易通过氢键相连。
有些限制性内切酶的切口,成为平头末端(blunt ends)
不同的DNA分子上若有某一种限制性内切酶的位点,均能被该酶切断,并产生相同的切口,这对重组DNA分子很有利。
拼接方法:
1,黏性末端
2.均聚体尾部 (homopolymeric tailing)
3.化学合成的接头 (chemical synthetic linker)
三、重组DNA分子引入宿主细胞
(一) 原核细胞最常用的是大肠杆菌,要选择合适的菌株(strain)。宿主细胞先经氯化钙处理,以改变细胞膜的通透性,使重组DNA分子容易进入。这种将重组质粒DNA分子引入细菌,使其在细菌体内扩增及表达的过程称为转化 (transformation)。
(二) 动物细胞宿主细胞主动摄取或被动引入外源DNA片段或重组DNA分子的过程称为转染(transfection)。进入细胞内的DNA可以被整合至宿主的基因组中,也可以在染色体外生活表达,这就需要采用含有能在真核细胞生活的结构成分的载体。可用磷酸钙介导(calcium-phosphate mediated)使外源DNA形成沉淀颗粒,颗粒若沉着在动物细胞的表面,以利细胞将这些颗粒摄入。近年用脂质体(1iposome)介导外源DNA的转移,可提高转染效率。用电穿孔(electroporation)方法,将外源DNA与宿主细胞放入特别的装置内,在高压电脉冲作用下,细胞外的DNA分子会在细胞膜上穿孔而入,并最终进入细胞核内,整合至宿主基因组中。用基因枪(颗粒轰击particle bombardment)方法是将外源DNA包裹了化学性质稳定的金或钨微粒以后,在电子发射装置或高压气流的驱动下,以极高速度打入受体细胞,组织和器官中,以进行基因转移技术。
用逆转录病毒(retrovirus)作为载体可以成功地感染动物细胞。另外可用微注射(microinjection)的方法,将外源DNA分子直接注射入细胞内或核内。近年发展一种转基因(transgenic)小鼠方法,即将重组DNA分子注射于单细胞受精卵的原核内,然后再将其植入一假妊娠母鼠的子宫内。生下的小鼠在全身各组织细胞的基因组DNA中都含有这种外源DNA,可以研究在整体条件下外源DNA的功能。
四、筛选
(一) 根据选择标志含有重组质粒DNA菌落的选择,主要可借用抗药性标记来筛选。例如,某一外源DNA片段,插在pBR322的PstⅠ位点,根据转化的情况,可以筛选被重组质粒转化的菌落。没有转化的细菌在含有氨苄青霉素或四环素的培养基中都不能生长;被重组质粒转化的细菌,在含有四环素的培养基中能生长,而在含有氨苄青霉素的培养基中则不能生长。未被重组的pBR322质粒转化的细菌则在这两种培养基中均能生长。因此,根据菌落的不同抗药性可以筛选出含有重组质粒的菌落。同理可以筛选出插入在四环素抗药性基因的质粒。
常根据噬菌体所含的LacZ基因是否被插入片段破坏来筛选。无色的噬菌斑表示LacZ被破坏,即这种噬菌体含有外源DNA。蓝色的噬菌斑,表示LacZ不被破坏,即不含插入片段。
(二) 菌落或噬菌斑原位斑点杂交用标记的已知DNA或RNA作为探针,来筛选所要的克隆(详见下述)。
(三) 蛋白质表达产物的测定可以用放射免疫方法来筛选,即先制备所要研究的蛋白质的抗体,再用放射性核素标记该抗体。若某一菌落或噬菌斑表达该种蛋白质,如原位杂交方法一样,先将其转移至膜上,再与放射性核素标记的抗体杂交。产生该蛋白质的菌落或噬菌斑,因抗体抗原的特异结合反应,又因抗体带上核素,所以经放射自显影术后会出现黑斑点。
五、一些常用的分子生物学技术
(—) 核酸分子杂交核酸分子杂交(molecular hybridization of nucleic acid)指序列互补单链的RNA与 DNA、DNA与DNA或RNA与RNA,根据碱基配对原则以氢键相连而形成杂交分子的过程。需要有一合适的探针(probe),一般指一段己知序列的DNA或RNA或化学合成的寡核苷酸。标记的探针与待测样品的DNA或RNA杂交,从而判断二者的同源性。若用标记的探针,在组织或细胞水平与细胞内的RNA或DNA进行杂交,则称为组织或细胞原位杂交。在染色体水平进行原位杂交则可测定某基因在染色体的定位。
1,DNA印迹
DNA印迹(Southern blot)是由英国科学家E,Southern于1975年提出的一种检测基因组DNA中特异序列的方法,故以作者的姓氏命名,此方法广泛地应用于分子生物学的研究,可以分析基因的结构、同源性和基因的拷贝数等。
本方法基本步骤:将高分子量DNA用合适的限制性内切酶酶解成一定的片段,进行琼脂糖凝胶电泳分离;电泳后用碱处理,使凝胶中的DNA变性成单股DNA,转移至硝酸纤维滤膜或尼龙膜上,并固定之;选择一合适的探针,用放射性核素或非核素标记方法,如生物素、地高辛(digoxigenin)等标记之,进行分子杂交;滤膜经放射自显影(autoradiography)处理后,即可得杂交DNA条带的放射自显影图,如图12-26所示。若用其他非核素标记的探针,可用相关方法使之产生色带或发光带。
2,RNA印迹
RNA印迹(Northern blot)方法主要是用来检测特异mRNA的表达情况及mRNA分子的大小,特别是用于研究细胞生长、分化、发育过程中有关基因的表达或组织细胞在病理条件下(如恶性肿瘤)某些基因的表达异常。由于DNA印迹方法以作者Southern(南)命名,故此方法则便称为Northern (北) blot。
基本步骤是:先提取完整RNA;再进行RNA变性琼脂糖凝胶电泳,变性条件下可破坏RNA的局部双螺旋,使其成线状单链,有利于杂交及分子大小的判断;其它步骤的原理与Southern印迹相似。
3.斑点杂交(dot hybridization)
(1) DNA和RNA斑点杂交
直接将变性DNA或RNA点样于硝酸纤维薄膜上,晾干后与放射性核素标记的探针进行杂交及放射自显影,以观察所要研究的基因或mRNA是否存在,并可以比较相对量的高低。
(2) 菌落和噬菌斑原位斑点杂交
上述构建基因组克隆文库和cDNA克隆文库,若要从文库中筛选出某特异克隆,常用菌落或噬菌体斑原位斑点杂交(in situ dot hybridization)将一大小相当的硝酸纤维滤膜放置于生长众多的细菌集落或噬菌体斑的主平板上(master plate),使每一集落的细菌或噬菌体斑转移至滤膜的相应位置,然后使细菌裂解,释放出的DNA固定于滤膜,则可与放射性核素标记的探针杂交及放射自显影,根据杂交斑点的出现,可以确定所要筛选的克隆。
(二) 蛋白质印迹蛋白质印迹(Western blot)与RNA印迹称为Northern印迹的习惯相似,此法也称为
Western(西)印迹。本方法利用特异抗体来鉴定相应的蛋白质。基本原理如下:将待分析的样本进行SDS聚丙烯酰胺凝胶电泳分离。电泳后将凝胶中的蛋白质电转移至硝酸纤维滤膜上,然后与所要研究的蛋白质的抗体(一级)进行特异免疫结合反应。再利用125Ⅰ标记的抗一级抗体的二级抗体反应,再经放射自显影术。可根据放射性的强弱来估计该蛋白质含量的多少。若与已知分子量的标准蛋白质位置比较,可推知该蛋白质的分子量。也可以利用其他二级抗体,如生物素标记的二级抗体,然后再与结合辣根过氧化酶的抗生物素蛋白质(avidin-horseradish peroxidase)反应,在底物过氧化氢的存在下,该蛋白质部位出现紫色的产物条带。
(三) DNA芯片或基因芯片
DNA芯片(DNA chip)是由数千个乃至上万基因序列(cDNA或寡核苷酸)自动加样并紧密地固定于一块很小的玻璃片(或膜片)的载体上,这载体也称为DNA微阵列(DNA microarrays)。可以用于分析基因组广泛的表达,能同时地分析大量基因的表达,分析在特异的生理反应或发育过程的整个转录情况。
如当比较两个样品中基因表达差异时,将两个不同组织或细胞样品的总mRNA提取出来,在反转录时分别以两种不同荧光染料标记合成的cDNA,然后等量混匀用作为探针,点样到DNA微阵列上。在阵列上的每个基因与其互补的制备的cDNA杂交。经洗涤除去未杂交的cDNA,在微阵列上的每个斑点,用计算机的扫描共聚焦激光显微镜进行分析。测定每个斑点的荧光强度,并将数据储存在计算机中。
(四) 聚合酶链反应聚合酶链反应(polymerase chain reactron,PCR)又称体外基因扩增方法,是20世纪80年代中期由Mullis发明的一种新的分子生物学技术。它能在实验室的试管内,将所要研究的一个目的基因或某一DNA片段,在数小时内扩增成百万倍乃至千万倍,使肉眼能够直接观察和判断该基因或DNA片段的存在。若配合适当的限制性内切酶,可以直接分析该基因的结构。只要一根毛发、一个精子、一滴血的DNA,即使经甲醛固定,石蜡包埋的组织、甚至被冷冻数万年的组织,都可用于基因结构的分析。
PCR的基本原理:PCR与体内DNA复制过程相似,是在体外由3个基本步骤组成的循环反应,如图12-27所示。
1,变性(denaturation) 将所要扩增的基因片段加热,使双链DNA解离成单链DNA。
2,退火(annealing) 当温度下降时,引物与所要扩增的基因两侧的DNA结合。化学合成一对与两侧DNA碱基序列互补的寡核苷酸作为引物,长度一般为20~30核苷酸,与所要扩增基因两侧的DNA相结合。
3,延伸(extension) 在合适的缓冲液、Mg2+及4种dNTP存在下,72 0C时耐热性TaqDNA聚合酶能忠实地按模板(待扩增基因)碱基序列迅速合成互补链,即从引物3′端-OH进行延伸,合成的方向为5′→3′,从而合成2分子与原来结构相同的基因片段。
上述3个基本步骤可按照变性— 退火— 延伸重复循环,每循环一次约需2min,DNA分子数即按(2 n)指数倍增,若循环次数n=25,可倍增百万倍。
PCR产物进行凝胶电泳,电泳后经溴乙啶染色,借紫外灯观察结果。并需进一步对PCR产物进行特异性的分析。
逆转录酶PCR(reverse transcriptase-PCR,RT-PCR),是以mRNA为模板经逆转录酶催化生成cDNA及扩增cDNA的方法。RT-PCR对于从稀少mRNA样品构建大容量的cDNA文库是极为灵敏和通用的方法。还可用于测定基因转录的强度
(五) DNA序列分析
DNA序列分析(DNA sequencing)已成为重组DNA技术的一种常用方法,目前应用最广的是经过不断改进的Sanger的“末端终止法”。
现在已有通过荧光标记来进行检测的DNA自动测序仪。目前水稻全基因组DNA序列分析已完成。人类基因组23条染色体2.9x109bp全部DNA序列已于2003年分析清楚,为揭开人类生命的奥密作出重要的贡献。