蛋白质合成后的分泌及加工修饰
不论是原核还是真核生物,在细胞浆内合成的蛋白质需定位于细胞特定的区域,有些蛋白质合成后要分泌到细胞外,这些蛋白质叫做分必蛋白。在细菌细胞内起作用的蛋白质一般靠扩散作用而分布到它们的目的地。如内膜含有参与能量代谢和营养物质转运的蛋白质;外膜含有促进离子和营养物质进入细胞的蛋白质;在内膜与外膜之间的间隙称为周质,其中含有各种水解酶以及营养物质结合蛋白。
真核生物细胞结构更为复杂,而且有多种不同的细胞器,它们又具有各不相同的膜结构,因此合成好的蛋白质还要面临跨越不同的膜而到达细胞器械,有些蛋白质在翻译完成后还要经过多种共价修饰,这个过程叫做翻译后处理。
(一)细菌中蛋白质的越膜
细胞的内膜蛋白,外膜蛋白和周质蛋白是怎样越过内膜而到其目的地的呢?绝大多数越膜蛋白的N端都具有大约15-30个以疏水氨基酸为主的N端信号序列或称信号肽。信号肽的疏水段能形成一段α螺旋结构。在信号序列之后的一段氨基酸残基也能形成一段α螺旋,两段α螺旋以反平行方式组成一个发夹结构,很容易进入内膜的脂双层结构,一旦分泌蛋白质的N端锚在膜内,后续合成的其它肽段部分将顺利通过膜。疏水性信号肽对于新生肽链跨膜及把它固定的膜上起一个拐掍作用。之后位于内膜外表面的信号肽酶将信号肽序列切除。当蛋白质全部翻译出来后,羧端穿过内膜,在周质中折叠成蛋白质的最终构象(图1)。
图1 蛋白质合成后的分泌过程
(二)真核生物蛋白质的分泌
真核生物不但有细胞核、细胞质和细胞膜,而且还有许多膜性结构的细胞器,在细胞须内合成的蛋白质怎样的到达细胞的不同部位呢?了解比较清楚的是分泌性蛋白质的转运。
像原核细胞一要,真核细胞合成的蛋白质N端也有信号肽也能形成两个 α螺旋的发夹结构,这个结构可插入到内质网的膜中,将正在合成中的多肽链带和内质网内腔。80年代中期在胞浆中发现一种由小分子RNA和蛋白质共同组成的复合物,它能特异地与信号肽识别而命名为信号肽识别颗粒。它的作用是识别信号肽与核糖体结合并暂时阻断多肽链的合成。内质网外膜上的SRP受体,当ARP与受体结合后,信号肽就可插入内质网进入内腔,被内质网内膜壁上的信号肽酶水解除去SRP与受体结合后,信号肽就可插入内质网进入内腔,被内质网内腔壁上的信号肽酶水解除去 SRP与受体解离并进入新的循环,而信号肽后序肽段也进入内质网内腔,并开始继续合成多肽链(图2)。
图2 在蛋白质越过内质网的转运过程中,SRP和船坞蛋白(或SRP受体)的作用
SRP对翻译阶段作用的重要生理意义在于:分泌性蛋白及早进入细胞的膜性细胞,能够正确的折叠、进行必要的后期加工与修饰并顺利分泌出细胞。
现以哺乳动物的胰岛素为例说明这种分泌过程。胰岛素由51个氨基酸残基组成,但胰岛素mRNA的翻译产和在兔网织红细胞无细胞翻译体系中为86个氨基酸残基,称为胰岛素原,在麦胚无细胞翻译系统中为110个氨基酸残基组成的前胰岛素原,后来证明,在前胰岛素原的N末端有一段富含疏水氨基酸的肽段做为信号肽,使前胰岛素原能穿越内质网膜进入内质网内腔,在内腔壁上信号肽被水介。所以在哺乳动物细胞内,当多肽链合成完成时,前胰岛素原已成为胰岛素原。然后胰岛素原被运到高尔基复合体,切去C肽成为成熟的胰岛素,最终排出胞外。像真核细胞的前清蛋白,免疫球白轻链,催乳素等都有相似的分必方式 。
(三)蛋白质翻译后加工修饰
从核糖体上释放出来的多肽链,按照一级结构中氨基酸侧链的性质,自竹卷曲,形成一定的空间结构,过去一直认为,蛋白质空间结构的形成靠是其一级结构决定的,不需要另外的信息。近些年来发现许多细胞内蛋白质正确装配都需要一类称做“分了伴娘”的蛋白质帮助才能完成,这一概念的提出并未否定“氨基酸顺序决定蛋白空间结构”这一原则。而是对这一理论的补充,分子伴娘这一类蛋白质能介导其它蛋白质正确装配成有功能活性的空间结构,而它本身并不参与最终装配产物的组成。目前认为“分子伴娘”蛋白有两类,第一类是一些酶,例如蛋白质二硫键异构酶可以识别和水解非正确配对的二硫键,使它们在正确的半胱氨酸残基位置上重新形成二硫键,第二类是一些蛋白质分子,它们可以和部分折叠或没有折叠的蛋白质分子结合,稳定它们的构象,免遭其它酶的水解或都促进蛋白质折叠成正确的空间结构。总之“分子伴娘”蛋白质合成后折叠成正确空间结构中起重要作用,对于大多数蛋白质来说多肽链翻译后还要进行下列不同方式的加工修饰才具有生理功能。
1.氨基端和羧基端的修饰
在原核生物中几乎所有蛋白质都是从N-甲酰蛋氨酸开始,真核生物从蛋氨酸开始。甲酰基经酶水介而除去,蛋氨酸或者氨基端的一些氨基酸残基常由氨肽酶催化而水介除去。包括除去信号肽序列。因此,成熟的蛋白质分子N-端没有甲酰基,或没有蛋氨酸。同时,某些蛋白质分子氨基端要进行乙酰化在羧基端也要进行修饰。
2.共价修饰
许多的蛋白质可以进行不同的类型化学基团的共价修饰,修饰后可以表现为激活状态,也可以表现为失活状态。
(1)磷酸化:
磷酸化多发生在多肽链丝氨酸,苏氨酸的羟基上,偶尔也发生在酪氨酸残基上,这种磷酸化的过程受细胞内一种蛋白激酶催化,磷酸化后的蛋白质可以增加或降低它们的活性,例如:促进糖原分解的磷酸化酶,无活性的磷酸化酶b经磷酸化以后,变居有活性的磷酸化酶a。而有活性的糖原合成酶I经磷酸化以后变成无活性的糖原合成酶D,共同调节糖元的合成与分介。
(2)糖基化:
质膜蛋白质和许多分泌性蛋白质都具有糖链,这些寡糖链结合在丝氨酸或苏氨酸的羟基上,例如红细胞膜上的ABO血型决定簇。也可以与天门冬酰胺连接。这些寡糖链是在内质网或高尔基氏体中加入的(图3)。
图3 糖蛋白中常见的糖一肽连接键
(3)羟基化:
胶原蛋白前α链上的脯氨酸和赖氨酸残基在内质网中受羟化酶、分子氧和维生素C作用产生羟脯氨酸和羟赖氨酸,如果此过程受障碍胶原纤维不能进行交联,极大地降低了它的张力强度。
(4)二硫键的形成:
?mRNA上没有胱氨酸的密码子,多肽链中的二硫键,是在肽链合成后,通过二个半胱氨酸的疏基氧化而形成的,二硫键的形成对于许多酶和蛋白质的活性是必需的。
3.亚基的聚合:
有许多蛋白质是由二个以上亚基构成的,这就需这些多肽链通过非共价键聚合成多聚体才能表现生物活性。例如成人血红蛋白由两条α链,两条β链及四分子血红素所组成,大致过程如下:α链在多聚核糖体合成后自行释下,并与尚未从多聚核糖体上释下的β链相连,然后一并从多聚核糖体上脱下来,变成α、β二聚体。此二聚体再与线粒体内生成的两个血红素结合,最后形成一个由四条肽链和四个血红素构成的有功能的血红蛋白分子。
4.水介断链:
一般真核细胞中一个基因对应一个mRNA,一个mRNA对应一条多肽链,但也有少数的情况,即一种三思而行翻译后的多肽链经水介后产生几种不同的蛋白质或多肽。例如哺乳动物的鸦片样促黑皮激素原初翻译产物为265个氨基酸,它在脑下垂体前叶细胞中,POMC初切割成为N-端片断和C端片段的β-促脂解激素。然后N端片段又被切割成较小的N端片断和工9肽的促肾上腺皮质激素。而在脑下垂体中叶细胞中,β-促脂解激素再次被切割产生β-内啡肽;ACTH也被切割产生13肽的促黑激素(α-melanotropin)(图4)。
???图4 POMC作为多种活性物质的前体
第一行为POMC前体,K、R为赖氨酸和精氨酸残基
蛋白质合成的抑制剂
影响蛋白质生物合成的物质非常多,它们可以作用于DNA复制和RNA转录,对蛋白质的生物合成起间接作用,本节主要讨论抑制蛋白质生物合成翻译过程的阻断剂。
(一)抗生素类阻断剂:
许多抗生素都是以直接抑制细菌细胞内蛋白质合成而对人体副作用最小为目的而设计的,它们可作用于蛋白质合成的各个环节,包括抑制起始因子,延长因子及核糖核蛋白体的作用等等。
1、链霉素、卡那霉素、新霉素等:
这类抗生素属于基甙类,它们主要抑制革兰氏阴性细菌蛋白质合成的三个阶段:①S起始复合物的形成,使氨基酰tRNA从复合物中脱落;②在肽链延伸阶段,使氨基酰tRNA与mRNA错配;③在终止阶段,阻碍终止因了与核蛋白体结合,使已合成的多肽链无法释放,而且还抑制70S核糖体的介离。
2、四环素和土霉素:
①作用于细菌内30S小亚基,抑制起始复合物的形成,②抑制氨西藏 酰tRNA进入核糖体的A位,阻滞肽链的延伸;③影响终止因子与核糖体的结合,使已合成的多肽链不能脱落离核糖体。四环素类抗生素除对菌体70S核糖体有抑制作用外,对人体细胞的80S核糖体也有抑制作用,但对70S核糖体的敏感性更高,故对细菌蛋白质合成抑制作用更强。
3、氯霉素:
属于广谱抗生素。①氯霉素与核糖体上的A位紧密结合,因此阻碍氨基酰tRNA进入A位,②抑制转肽酶活性,使肽链延伸受到影响,菌体蛋白质不能合成,因此有较哟的抑菌作用。
4、嘌呤霉素(Puromycin)
结构与酪氨酰-tRNA相似,从而取代一些氨基酰tRNA进入核糖体的A位,当延长中的肽转入此异常A位时,容易脱落,终止肽链合成。由于嘌呤霉素对原核和真核生物的翻译过程均有干扰干扰作用,故难于用做抗菌药物,有人试用于肿瘤治疗(图1)。
图1 嘌呤霉素(左)与tyr-tRNAtyr(右)
5、白喉霉素(diphtheria toxin)
由白喉杆菌所产生的白喉霉素是真核细胞蛋白质合成抑制剂。白喉霉素实际上是寄生于白喉杆菌体内的溶源性噬菌体β基因编码的由白喉杆菌转运分泌出来,进入组织细胞内,它对真核生物的延长因子-2(EF-2)起共价修饰作用,生成EF-2腺苷二磷酸核糖衍生物,从而使EF-2失活,它的催化效率很高,只需微量就能有效地抑制细胞整个蛋白质合成,而导致细胞死亡(图2)。
图2 白喉毒素的作用
(二)干扰素对病毒蛋白合成的抑制
干扰素(interferon)是病毒感染后,感染病毒的细胞合成和分泌的一种小分子蛋白质。从白细胞中得到α-干扰素,从成纤维细胞中得到β-干扰素,在免疫细胞中得到γ-干扰素。干扰素结合到未感染病毒的细胞膜上,诱导这些细胞产生寡核苷酸合成酶、核酸内切酶和蛋白激酶。在细胞未被感染时,不合成这三种酶,一旦被病毒感染,有干扰素或双链RNA存在时,这些酶被激活,并以不同的方式阻断病毒蛋白质的合成。干扰素和dsRNA激活蛋白激酶,蛋白激酶使蛋白质合成的起始因子磷酸化,使它失活,另一种方式是mRNA的降介,干扰素dsRNA激活2,5腺嘌呤寡核苷酸合成的酶的合成,2,5腺嘌呤寡核苷酸激活核酸内切酶,核酸内切酶水介mRNA(图18-24)。
由于干扰素具有很强的抗病毒作用,因此在医学上有重大的实用价值,但组织中含量很少,难于从生物组织中大量分离干扰素。现在已难应用基因工程合成干扰素以满足研究与临床应用的需要。
?小结
蛋白质分子是由一个个氨基酸通过肽键连接起来的,在细胞内这种连接必须依靠核蛋白体循环来完成。mRNA携带合成蛋白质分子中氨基酸排列顺序遗传的信息。这是由每3个碱基组成一个密码来体现的,遗传密码共有64个密码子。UAA、UAG、UGA代表终止信号,AUG不仅代表起始信号,还代表蛋氨酸。tRNA携带特异的氨基酸,同时它的反密码子可识别mRNA上的密码子,核糖体上受位和给位结合的氨基酸在转肽酶的作用下形成肽键。
合成蛋白质分子的每个氨基酸首先要在特异的氨基酰tRNA合成的酶的作用下,与特异的tRNA结合,形成氨基酰tRNA,这就是氨基酸的活化。核蛋白循环过程中的起动阶段,首先要形成由起始因子,GTP、mRNA和大、小亚基构成的70S起始复合物,肽链延长时,每进入一个氨基酸,就按进位,转肽、脱落、移位、重复这四个步骤。终止时,在终止因子参与下,转肽酶将合成的肽链水解离开核糖体,核蛋白体也从mRNA脱落,重新进入又一个循环,蛋白质合成时,在一条mRNA链上,同时结合着多个核糖体,同时合成相同的多条肽链。
蛋白质合成也有许多加工修饰过程,剪切一部分肽段,加入糖、脂,进行磷酸化,羟化等等。多聚体构成的蛋白质还要经过聚合过程。
蛋白质合成的阻断剂很多,作用部位也各不相同,利用这些理论,对于研制各种抗生素有重要意义。
基因表达调控的现象和概念
(Gene Expression and Its Regulation)
基因表达调控的现象和概念
一、基因表达调控是生命的必需??
基因表达(gene expression)是指储存遗传信息的基因经过一系列步骤表现出其生物功能的整个过程。典型的基因表达是基因经过转录、翻译,产生有生物活性的蛋白质的过程。rRNA或tRNA的基因经转录和转录后加工产生成熟的rRNA或tRNA,也是rRNA或tRNA的基因表达,因为rRNA或tRNA就具有在蛋白质翻译方面的功能。
基因组(genome)是指含有一个生物体生存、发育、活动和繁殖所需要的全部遗传信息的整套核酸。但生物基因组的遗传信息并不是同时全部都表达出来的,即使极简单的生物(如最简单的病毒),其基因组所含的全部基因也不是以同样的强度同时表达的。大肠杆菌基因组含有约4000个基因,一般情况下只有5-10%在高水平转录状态,其它基因有的处于较低水平的表达,有的就暂时不表达。哺乳类基因组更复杂,人的基因组约含有10万个基因,但在一个组织细胞中通常只有一部分基因表达,多数基因处在沉静状态,典型的哺乳类细胞中开放转录的基因约在1万个上下,即使蛋白质合成量比较多、基因开放比例较高的肝细胞,一般也只有不超过20%的基因处于表达状态。
生物个体的各种组织细胞一般都有相同的染色体数目,每个细胞含的DNA量基本相近。最初经典的遗传学认为只有生殖细胞能够繁衍后代,随着科学的发展,能将植物的一些体细胞(如叶细胞)培育成为完整的植株,成年山羊的乳腺细胞在适当的条件下也能分化发育成山羊个体(克隆羊),表明这些体细胞也像生殖细胞一样含有个体发育、生存和繁殖的全部遗传信息。但这些遗传信息的表达是受到严格调控的,通常各组织细胞只合成其自身结构和功能所需要的蛋白质。不同组织细胞中不仅表达的基因数量不相同,而且基因表达的强度和种类也各不相同,这就是基因表达的组织特异性(tissue specificity)。例如肝细胞中涉及编码鸟氨酸循环酶类的基因表达水平高于其它组织细胞,合成的某些酶(如精氨酸酶)为肝脏所特有;胰岛β细胞合成胰岛素;甲状腺滤泡旁细胞(C细胞)专一分泌降血钙素等。细胞特定的基因表达状态,就决定了这个组织细胞特有的形态和功能。如果基因表达调控发生变化,细胞的形态与功能也会随之改变,例如正常组织细胞转化为癌瘤细胞的过程,就首先有基因表达方面的改变;人肝细胞在胚胎时期合成甲胎蛋白(alfafetal protein, AFP),成年后就很少合成AFP了,但当肝细胞转化成肝癌细胞时编码AFP的基因又会开放,合成AFP的量会大幅度提高,成为肝癌早期诊断的一个重要指标;人肺组织并不合成降血钙素,但某些肺组织细胞癌变时,合成降血钙素的基因会开放,能分泌降血钙素,引起血钙降低的症状。
细胞分化发育的不同时期,基因表达的情况是不相同的,这就是基因表达的阶段特异性(stagespecificity)。一个受精卵含有发育成一个成熟个体的全部遗传信息,在个体发育分化的各个阶段,各种基因极为有序地表达,一般在胚胎时期基因开放的数量最多,随着分化发展,细胞中某些基因关闭(turn off)、某些基因转向开放(turn on),胚胎发育不同阶段、不同部位的细胞中开放的基因及其开放的程度不一样,合成蛋白质的种类和数量都不相同,显示出基因表达调控在空间和时间上极高的有序性,从而逐步生成形态与功能各不相同、极为协调、巧妙有序的组织脏器。即使是同一个细胞,处在不同的细胞周期状态,其基因的表达和蛋白质合成的情况也不尽相同,这种细胞生长过程中基因表达调控的变化,正是细胞生长繁殖的基础。
从上所述,不难看出:生物的基因表达不是杂乱无章的,而是受着严密、精确调控的,尽我们现在对调控机理的奥妙所知还不多,但已经可以认识到,不仅生命的遗传信息是生物生存所必需的,而且遗传信息的表达调控也是生命本质所在。
二、基因表达适应环境的变化
生物只有适应环境才能生存。当周围的营养、温度、湿度、酸度等条件变化时,生物体就要改变自身基因表达状况,以调整体内执行相应功能蛋白质的种类和数量,从而改变自身的代谢、活动等以适应环境。生物体内的基因调控各不相同,仔细观察基因表达随环境变化的情况,可以大致把基因表达分成两类:
①组成性表达(constitutive expression)指不大受环境变动而变化的一类基因表达。其中某些基因表达产物是细胞或生物体整个生命过程中都持续需要而必不可少的,这类基因可称为看家基因(housekeeping gene),这些基因中不少是在生物个体其它组织细胞、甚至在同一物种的细胞中都是持续表达的,可以看成是细胞基本的基因表达。组成性基因表达也不是一成不变的,其表达强弱也是受一定机制调控的。
②适应性表达(adaptive expression)指环境的变化容易使其表达水平变动的一类基因表达。应环境条件变化基因表达水平增高的现象称为诱导(induction),这类基因被称为可诱导的基因(inducible gene);相反,随环境条件变化而基因表达水平降低的现象称为阻遏(repression),相应的基因被称为可阻遏的基因(repressible gene)。
改变基因表达的情况以适应环境,在原核生物、单细胞生物中尤其显得突出和重要,因为细胞的生存环境经常会有剧烈的变化。例如:周围有充足的葡萄糖,细菌就可以利用葡萄糖作能源和碳源,不必更多去合成利用其它糖类的酶类,当外界没有葡萄糖时,细菌就要适应环境中存在的其它糖类(如乳糖、半乳糖、阿拉伯糖等),开放能利用这些糖的酶类基因,以满足生长的需要。即使是内环境保持稳定的高等哺乳类,也经常要变动基因的表达来适应环境,例如与适宜温度下生活相比较,在冷或热环境下适应生活的动物,其肝脏合成的蛋白质图谱就有明显的不同;长期摄取不同的食物,体内合成代谢酶类的情况也会有所不同。所以,基因表达调控是生物适应环境生存的必需。
原核基因表达调控
细菌能随环境的变化,迅速改变某些基因表达的状态,这就是很好的基因表达调控的实验型。人们就是从研究这种现象开始,打开认识基因表达调控分子机理的窗口的。
一、操纵元的提出
大肠杆菌可以利用葡萄糖、乳糖、麦芽糖、阿拉伯糖等作为碳源而生长繁殖。当培养基中有葡萄糖和乳糖时,细菌优先使用葡萄糖,当葡萄糖耗尽,细菌停止生长,经过短时间的适应,就能利用乳糖,细菌继续呈指数式繁殖增长(图1)。
图1 大肠杆菌二阶段生长现象
图2 β-半乳糖苷酶的作用
大肠杆菌利用乳糖至少需要两个酶:促使乳糖进入细菌的乳糖透过酶(lactose permease)催化乳糖分解第一步的β-半乳糖苷酶(β-galactosidase)(图2)。
在环境中没有乳糖或其他β-半乳糖苷时,大肠杆菌合成β-半乳糖苷酶量极少,加入乳糖2-3分钟后,细菌大量合成β-半乳糖苷酶,其量可提高千倍以上,在以乳糖作为唯一碳源时,菌体内的β-半乳糖苷酶量可占到细菌总蛋白量的3%。在上述二阶段生长细菌利用乳糖再次繁殖前,也能测出细菌中β-半乳糖苷酶活性显著增高的过程。这种典型的诱导现象,是研究基因表达调控的极好模型。
图3 Jacob和Monod提出的lac operon模
针对大肠杆菌利用乳糖的适应现象,法国的Jacob和Monod等人做了一系列遗传学和生化学研究实验,于1961年提出乳糖操纵元(lac operon)学说,如图3所示。图3中z、a和b型是大肠杆菌编码利用乳糖所需酶类的基因,p是转录z、a、b所需要的启动子,调控基因i编码合成调控蛋白R,R能与o结合而阻碍从p开始的基因转录,所以o就是调节基因开放的操纵序列,乳糖能改变R结构使其不能与o结合,因而乳糖浓度增高时基因就开放,转录合成所编码的酶类,这样大肠杆菌就能适应外界乳糖供应的变化而改变利用乳糖的状况,这个模型是人们在科学实验的基础上第一次开始认识基因表达调控的分子机理。
二、操纵元(operon)的基本组成
乳糖操纵元模型被以后的许多研究实验所证实,对其有了更深入的认识,并且发现其他原核生物基因调控也有类似的操纵元组织,操纵元是原核基因表达调控的一种重要的组织形式,大肠杆菌的基因多数以操纵元的形式组成基因表达调控的单元。下面就以半乳糖操纵元为例子说明操纵元的最基本的组成元件(elements)。
(一)结构基因群
操纵元中被调控的编码蛋白质的基因可称为结构基因(structural gene, SG)。一个操纵元中含有2个以上的结构基因,多的可达十几个。每个结构基因是一个连续的开放读框(open reading frame),5′端有翻译起始码(DNA存储链上是ATG,转录成mRNA就是AUG),3′端有翻译终止码(DNA存储链上是TAA、TGA或TAG,转录成mRNA就是UAA、UGA或UAG)。各结构基因头尾衔接、串连排列,组成结构基因群。至少在第一个结构基因5′侧具有核糖体结合位点(ribosome binding site, RBS),因而当这段含多个结构基因的DNA被转录成多顺反子mRNA,就能被核糖体所识别结合、并起始翻译。核糖体沿mRNA移动;在合成完第一个编码的多肽后,核糖体可以不脱离mRNA而继续翻译合成下一个基因编码的多肽,直至合成完这条多顺反子mRNA所编码的全部多肽。
乳糖操纵元含有z、y和a三个结构基因。z基因长3510bp,编码含1170个氨基酸、分子量为135,000的多肽,以四聚体形式组成有活性的β-半乳糖苷酶,催化乳糖转变为别乳糖(allolactose),再分解为半乳糖和葡萄糖;y基因长780bp,编码由260个氨基酸组成、分子量30000的半乳糖透过酶,促使环境中的乳糖进入细菌;a基因长825bp,编码含275氨基酸、分子量为32000的转乙酰基酶,以二聚体活性形式催化半乳糖的乙酰化。z基因5′侧具有大肠杆菌核糖体识别结合位点(ribosome binding site, RBS)特征的ShineDalgarno(SD)序列,因而当乳糖操纵元开放时,核糖体能结合在转录产生的mRNA上。由于z、y、a三个基因头尾相接,上一个基因的翻译终止码靠近下一个基因的翻译起始码,因而同一个核糖体能沿此转录生成的多顺反子(polycistron) mRNA移动,在翻译合成了上一个基因编码的蛋白质后,不从mRNA上掉下来而继续沿mRNA移动合成下一个基因编码的蛋白质,一气依次合成基因群所编码的所有蛋白质。
(二)启动子
启动子(promoter,P)是指能被RNA聚合酶识别、结合并启动基因转录的一段DNA序列。操纵元至少有一个启动子,一般在第一个结构基因5′侧上游,控制整个结构基因群的转录。用RNA聚合酶与分离的一段DNA双链混合,再加入外切核酸酶去水解DNA,结果只有被RNA聚合酶识别结合而被保护的那段DNA不被水解,由此可以测出启动子的范围及其序列。虽然不同的启动子序列有所不同,但比较已经研究过的上百种原核生物的启动子的序列,发现有一些共同的规律,它们一般长40-60bp,含A桾碱基对较多,某些段落是很相似的,这些相似的保守性段落称为共有性序列(consensus sequences)。如图4所示,启动子一般可分为识别(R,recognition)、结合(B, binding)和起始(I, initiation)三个区段。转录起始第一个碱基(通常标记位置为+1)最常见的是A;在-10bp附近有TATAAT一组共有序列,因为这段共有序列是Pribnow首先发现的,称为Pribnow盒(Pribnow box);在-35bp处又有TTGACA一组共有序列 。
图4 原核生物基因转录起始区
启动子名称
-35区
-10区
+1
P trp
……TTGACA……
N17……TTAACT…
N7……A……
P tyr-tRNA
……TTTACA……
N16……TATGAT…
N7…G……
P lac
……TTGACA……
N17……TATGTT…
N7…A……
P recA
……CTGATG……
N17……TATAAT…
N7…A……
P ara
……TTGACA……
N17……TACTGT…
N7…A……
λPR
……TTGACA……
N17……GATAAT…
N6…A……
λPL
……TTGACA……
N17……GATACT…
N6…A……
T7 A2
……TTGACA……
N17……TACGAT…
N6…A……
fd Ⅷ
……TTGACA……
N17……TATAAT…
N6…G……
?
不同的启动子序列不同,与RNA聚合酶的亲和力不同,启动转录的频率高低不同,即不同的启动子起动基因转录的强弱不同,例如:PL、PR、PT7属强启动子,而P1ac则是较弱的启动。
(三)操纵子
操纵子(operator)是指能被调控蛋白特异性结合的一段DNA序列,常与启动子邻近或与启动子序列重叠,当调控蛋白结合在操纵子序列上,会影响其下游基因转录的强弱。以前许多书中将操纵子称为操纵基因(operator gene)。但现在基因定义是为蛋白质编码的核酸序列,而操纵序列并不是编码蛋白质的基因,却是起着调控基因表达强弱的作用,正如启动序列不叫启动基因而称为启动子一样,操纵序列就可称为操纵子。以前将operon译为操纵子则可改译为操纵元,即基因表达操纵的单元之意。
举乳糖操纵元中的操纵子为例,如图5所示,其操纵子(o)序列位于启动子(p)与被调控的基因之间,部分序列与启动子序列重叠。仔细分析该操纵子序列,可见这段双链DNA具有回文(palindrome)样的对称性一级结构,能形成十字形的茎环(stem loop)构造。不少操纵子都具有类似的对称性序列,可能与特定蛋白质的结合相关。
图5 乳糖操纵元的P-O区及O区序列
阻遏蛋白与操纵子结合,就妨碍了RNA聚合酶与启动子的结合及其后β-半乳糖苷酶等基因的转录起始,从而阻遏了这群基因的表达。最早只把与阻遏蛋白结合、起阻遏作用的序列称为操纵子,但其后发现有的操纵元中同一操纵序列与不同构像的蛋白质结合,可以分别起阻遏或激活基因表达的作用,阿拉伯糖操纵元中的序列就是典型的例子。因而凡能与调控蛋白特异性结合、从而影响基因转录强弱的序列,不论其对基因转录的作用是减弱、阻止或增强、开放,都可称为操纵子。
(四)调控基因
调控基因(regulatory gene)是编码能与操纵序列结合的调控蛋白的基因。与操纵子结合后能减弱或阻止其调控基因转录的调控蛋白称为阻遏蛋白(repressive protein),其介导的调控方式称为负性调控(negative regulation);与操纵子结合后能增强或起动调控基因转录的调控蛋白称为激活蛋白(activating protein),所介导的调控方式称为正性调控(positive regulation)。
某些特定的物质能与调控蛋白结合,使调控蛋白的空间构像发生变化,从而改变其对基因录的影响,这些特定物质可称为效应物(effector),其中凡能引起诱导发生的分子称为诱导剂(inducer),能导致阻遏发生的分子称为阻遏剂或辅助阻遏剂(corepressor)。
例如在乳糖操纵元中,调控基因1ac I位于P1ac邻近,有其自身的启动子和终止子,转录方向和结构基因群的转录方向一致,编码产生由347个氨基酸组成的调控蛋白R,在环境没有乳糖存在的情况下,R形成分子量为152000的活性四聚体,能特异地与操纵子o紧密结合,从而阻止利用乳糖的酶类基因的转录,所以R是乳糖操纵元的阻遏蛋白;当环境中有足够的乳糖时,乳糖受β-半乳糖苷酶作用转变为别乳糖,别乳糖与R结合,使R的空间构像变化,四聚体解聚成单体,失去与操纵子特异性紧密结合的能力,从而解除了阻遏蛋白的作用,使其后的基因得以转录合成利用乳糖的酶类。在这过程中乳糖(实际起作用的是别乳糖)就是诱导剂,与R结合起到去阻遏作用(derepression),诱导了利用乳糖的酶类基因转录开放。
许多调控蛋白都是变构蛋白(allosteric protein),通过与上述类似的方式与效应物结合变空间构像,从而改变活性,起到调节基因转录表达的作用。
(五)终止子
终止子(terminator T)是给予RNA聚合酶转录终止信号的DNA序列。在一个操纵元中至少在构基因群最后一个基因的后面有一个终止子。
终止子按其作用是否需蛋白因子的协助至少可以分为两类:一类是不依赖ρ因子(蛋白性终止因子)的终止子,这类终止子在序列上有一些共通的特点,即有一段富含GC的反向重复序列(inverted repeat sequence),其后跟随一段富含AT的序列(见图6),因而转录生成的mRNA的序列中能形成发夹式结构,后继一连串U,正是RNA聚合酶转录生成的这段mRNA的结构阻止RNA聚合酶继续沿DNA移动,并使聚合酶从DNA链上脱落下来,终止转录。另一类是依赖ρ因子的终止子,即其终止转录的作用需要ρ因子的协同,或至少是受ρ因子的影响。
图6 原核生物终止子的结构
不同的终止子的作用也有强弱之分,有的终止子几乎能完全停止转录;有的则只是部分终止转录,一部分RNA聚合酶能越过这类终止序列继续沿DNA移动并转录。如果一串结构基因群中间有这种弱终止子的存在,则前后转录产物的量会有所不同,这也是终止子调节基因群中不同基因表达产物比例的一种方式。有的蛋白因子能作用于终止序列,减弱或取消终止子的作用,称为抗终止作用(antitermination),这种蛋白因子就称为抗终止因子(antiterminator)。
以上5种元件是每一个操纵元必定含有的。其中启动子、操纵子位于紧邻结构基因群的上游,终止子在结构基因群之后,它们都在结构基因的附近,只能对同一条DNA链上的基因表达起调控作用,这种作用在遗传学实验上称为顺式作用(cisaction),启动子、操纵子和终止子就属于顺式作用元件(cisacting element)。调控基因可以在结构基因群附近、也可以远离结构基因,它是通过其基因产物棗调控蛋白来发挥作用的,因而调控基因不仅能对同一条DNA链上的结构基因起表达调控作用,而且能对不在一条DNA链上的结构基因起作用,在遗传学实验上称为反式作用(transaction),调控基因就属于反式作用元件(transacting element),其编码产生的调控蛋白称为反式调控因子(transacting factor)。
由此也可窥测到,基因表达调控机理的关键在蛋白质与核酸的相互作用上。
三、乳糖操纵元的表达调控
如上所述乳糖操纵元的结构及其基因表达调控可综合于图7。
图7 乳糖操纵元的结构及调控示意图
(一)阻遏蛋白的负性调控
当大肠杆菌在没有乳糖的环境中生存时,1ac操纵元处于阻遏状态。i基因在其自身的启动子Pi控制下,低水平、组成性表达产生阻遏蛋白R,每个细胞中仅维持约10个分子的阻遏蛋白。R以四聚体形式与操纵子o结合,阻碍了RNA聚合酶与启动子P1ac的结合,阻止了基因的转录起动。R的阻遏作用不是绝对的,R与o偶尔解离,使细胞中还有极低水平的β-半乳糖苷酶及透过酶的生成。
当有乳糖存在时,乳糖受β-半乳糖苷酶的催化转变为别乳糖,与R结合,使R构象变化,R四聚体解聚成单体,失去与o的亲和力,与o解离,基因转录开放,β-半乳糖苷酶在细胞内的含量可增加1000倍。这就是乳糖对1ac操纵元的诱导作用。
一些化学合成的乳糖类似物,不受β-半乳糖苷酶的催化分解,却也能与R特异性结合,使R构象变化,诱导1ac操纵元的开放。例如异丙基硫代半乳糖苷(isopropylthiogalactoside, IPTG)就是很强的诱导剂,不被细胞代谢而十分稳定。X-gal(5-溴-4-氯-3-吲哚-β-半乳糖苷)也是一种人工化学合成的半乳糖苷,可被β-半乳糖苷酶水解产生兰色化合物,因此可以用作β-半乳糖苷酶活性的指示剂。IPTG和Xgal都被广泛应用在分子生物学和基因工程的工作中。
图8 乳糖,IPTG和Xgal的结构
(二)CAP的正性调控
细菌中的cAMP含量与葡萄糖的分解代谢有关,当细菌利用葡萄糖分解供给能量时,cAMP生成少而分解多,cAMP含量低;相反,当环境中无葡萄糖可供利用时,cAMP含量就升高。细菌中有一种能与cAMP特异结合的cAMP受体蛋白CRP(cAMP receptor protein),当CRP未与cAMP结合时它是没有活性的,当cAMP浓度升高时,CRP与cAMP结合并发生空间构象的变化而活化,称为CAP(CRPcAMP activated protein),能以二聚体的方式与特定的DNA序列结合。
在1ac操纵元的启动子P1ac上游端有一段与Plac部分重叠的序列,能与CAP特异结合,称为CAP结合位点(CAP binding site)。CAP与这段序列结合时,可增强RNA聚合酶的转录活性,使转录提高50倍。相反,当有葡萄糖可供分解利用时,cAMP浓度降低,CRP不能被活化,1ac操纵元的结构基因表达下降。
图9 葡萄糖利用对乳糖操纵元的影响
由于P1ac是弱启动子,单纯因乳糖的存在发生去阻遏使1ac操纵元转录开放,还不能使细胞很好利用乳糖,必须同时有CAP来加强转录活性,细菌才能合成足够的酶来利用乳糖。1ac操纵元的强诱导既需要有乳糖的存在,又需要没有葡萄糖可供利用。通过这种机制,细菌优先利用环境中的葡萄糖,只有无葡萄糖而又有乳糖时,细菌才去充分利用乳糖。
细菌对葡萄糖以外的其他糖(如阿拉伯糖、半乳糖、麦芽糖等)的利用上也有类似对乳糖利的情况,在含有编码利用阿拉伯糖的酶类基因群的阿拉伯糖操纵元(ara operon)、半乳糖操纵元(gal operon)中也有CAP结合位点,CAP也起类似的正性调控作用。所以CAP的通用名称是分解代谢基因激活蛋白(catabolic gene activator protein)。
不难看出:CAP结合位点就是一种起正性调控作用的操纵子,CAP则是对转录起正性作用的控蛋白棗激活蛋白,编码CRP的基因也是一个调控基因,不过它并不在1ac操纵元的附近,CAP可以对几个操纵元都起作用。
从上所述,乳糖操纵元属于可诱导操纵元(inducible operon),这类操纵元通常是关闭的,当受效应物作用后诱导开放转录。这类操纵元使细菌能适应环境的变化,最有效地利用环境能提供的能源底物。
四、色氨酸操纵元
色氨酸是构成蛋白质的组分,一般的环境难以给细菌提供足够的色氨酸,细菌要生存繁殖通常需要自己经过许多步骤合成色氨酸,但是一旦环境能够提供色氨酸时,细菌就会充分利用外界的色氨酸、减少或停止合成色氨酸,以减轻自己的负担。细菌所以能做到这点是因为有色氨酸操纵元(trp operon)的调控。
(一)色氨酸操纵元的结构与阻遏蛋白的负性调控
如图10所示,合成色氨酸所需要酶类的基因E、D、C、B、A等头尾相接串连排列组成结构基因群,受其上游的启动子Ptrp和操纵子o的调控,调控基因trpR的位置远离P-o-结构基因群,在其自身的启动子作用下,以组成性方式低水平表达分子量为47000的调控蛋白R。R并没有与o结合的活性,当环境能提供足够浓度的色氨酸时,R与色氨酸结合后构象变化而活化,就能够与o特异性亲和结合,阻遏结构基因的转录,因此这是属于一种负性调控的、可阻遏的操纵元(repressible operon),即这操纵元通常是开放转录的,当有效应物(色氨酸为阻遏剂)作用时,则阻遏关闭转录。细菌不少生物合成系统的操纵元都属于这种类型,其调控可使细菌处在生存繁殖最经济最节省的状态。
图10 色氨酸操纵元的结构和调控示意图
(二)衰减子及其作用
实验观察表明:当色氨酸达到一定浓度,但还没有高到能够活化R使其起阻遏作用的程度时,产生色氨酸合成酶类的量已经明显降低,而且产生的酶量与色氨酸浓度呈负相关。仔细研究发现这种调控现象与色氨酸操纵元特殊的结构有关。
图11 色氨酸操纵元中的衰减子结构及其调控示意图
在色氨酸操纵元Ptrp-o与第一个结构基因trpE之间有162bp的一段先导序列(leadingsequence, L)实验证明当色氨酸达一定浓度时,RNA聚合酶的转录会终止在这里。这段序列中含有编码由14个氨基酸组成的短肽的开放读框,其序列中有2个色氨酸相连,在此开放读框前有核糖体识别结合位点(RBS)序列,提示这段短开放读框在转录后是能被翻译的。在先导序列的后半段含有3对反向重复序列(图19?1中A、B及C),在被转录生成mRNA时都能够形成发夹式结构,但由于B的序列分别与A和C重叠,所以如果B形成发夹结构,A和C都不能再形成发夹结构;相反,当A形成发夹结构时,B就不能形成发夹结构,却有利于C生成发夹结构。C后面紧跟一串A(转录成RNA就是一串U),C实际上是一个终止子,如果转录mRNA时它形成发夹结构,就能使RNA聚合酶停止转录而从mRNA上脱离下来。
图12 三种不同情况下A、B、C形成发夹结构的状态
在色氨酸未达到能起阻遏作用的浓度时,从Ptrp起始转录,RNA聚合酶沿DNA转录合成mRNA,同时核糖体就结合到新生成的mRNA核糖体结合位点上开始翻译。当色氨酸浓度低时,生成的tRNAtrp色氨酸量就少,能扩散到核糖体mRNA形成的翻译复合体中供给合成短肽的几率低,使核糖体沿mRNA翻译移动的速度慢,赶不上RNA聚合酶沿DNA移动转录的速度,这时核糖体占据短开放读框的机会较多,使A不能生成发夹结构,于是B就形成发夹结构,阻止了C生成终止信号的结构,RNA聚合酶得以沿DNA前进,继续去转录其后trpE等基因,trp操纵元就处于开放状态。当色氨酸浓度增高时,tRNAtrp色氨酸浓度随之升高,核糖体沿mRNA翻译移动的速度加快,占据到B段的机会增加,B生成发夹结构的机会减少,C形成终止结构的机会增多,RNA聚合酶终止转录的的几率增加,于是转录减弱。如果当其他氨基酸短缺(注意:短开放读框编码的14肽中多数氨基酸能由环境充分供应的机会是不多的)或所有的氨基酸都不足时,核糖体翻译移动的速度就更慢,甚至不能占据A的序列,结果有利于A和C发夹结构的形成,于是RNA聚合酶停止转录,等于告诉细菌:“整个氨基酸都不足,即使合成色氨酸也不能合成蛋白质,不如不合成以节省能量 ”。
由此可见,先导序列起到随色氨酸浓度升高降低转录的作用,这段序列就称为衰减子attenuator)。在trp操纵元中,对结构基因的转录阻遏蛋白的负调控起到粗调的作用,而衰减子起到细调的作用。细菌其他氨基酸合成系统的许多操纵元(如组氨酸、苏氨酸、亮氨酸、异亮氨酸、苯丙氨酸等操纵元)中也有类似的衰减子存在。
真核基因表达调控
一、真核基因组的复杂性
与原核生物比较,真核生物的基因组更为复杂,可列举如下。
▲真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。
▲真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。
▲原核生物的基因组基本上是单倍体,而真核基因组是二倍体。
▲如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。
▲原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。
▲原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。
▲原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitive sequences)。用复性动力学等实验表明有三类重复序列:①高度重复序列(highly repetitive sequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。②中度重复序列(moderately repetitive sequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-×105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。③单拷贝序列(single copy sequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。
从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。
二、真核基因表达调控的特点
尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明显的特点。
(一)真核基因表达调控的环节更多
如前所述,基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。图1扼要地列出真核基因表达的各个可能的环节。
图1 真核生物基因表达调控的可能环节
图1总结了以前章节叙述过的基因表达过程,并作了一些新补充。图中标出了真核细胞在分化过程中会发生基因重排(gene rearrangement),即胚原性基因组中某些基因会再组合变化形成第二级基因。例如编码完整抗体蛋白的基因是在淋巴细胞分化发育过程中,由原来分开的几百个不同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能利用几百个抗体基因的片段,组合变化而产生能编码达108种不同抗体的基因,其中就有复杂的基因表达调控机理。
此外,真核细胞中还会发生基因扩增(gene amplification),即基因组中的特定段落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞在受精后的发育过程中其rRNA基因(可称为rDNA)可扩增2000倍,以后发现其他动物的卵细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质,需要有大量核糖体。又如MTX(methotrexate)是叶酸的结构类似物,一些哺乳类细胞会对含有利用叶酸所必需的二氢叶酸还原酶(dihydrofolate reductase, DHFR)基因的DNA区段扩增40?00倍,使DHFR的表达量显著增加,从而提高对MTX的抗性。基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。
(二)真核基因的转录与染色质的结构变化相关
真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:
1.染色质结构影响基因转录 细胞分裂时染色体的大部分到间期时松开分散在核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。染色体中的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期核中可以看到其浓集的斑块,称为异染色质(heterochromatin),其中从未见有基因转录表达;原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。可见紧密的染色质结构阻止基因表达。
2.组蛋白的作用 早期体外实验观察到组蛋白与DNA结合阻止DNA上基因的转录,去除组蛋基因又能够转录。组蛋白是碱性蛋白质,带正电荷,可与DNA链上带负电荷的磷酸基相结合,从而遮蔽了DNA分子,妨碍了转录,可能扮演了非特异性阻遏蛋白的作用;染色质中的非组蛋白成分具有组织细胞特异性,可能消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。
发现核小体后,进一步观察核小体结构与基因转录的关系,发现活跃转录的染色质区段,有富含赖氨酸的组蛋白(H1组蛋白)水平降低,H2A·H2B组蛋白二聚体不稳定性增加、组蛋白乙酰化(acetylation)和泛素化(ubiquitination),以及H3组蛋白巯基化等现象,这些都是核小体不稳定或解体的因素或指征。转录活跃的区域也常缺乏核小体的结构。这些都表明核小体结构影响基因转录。
3.转录活跃区域对核酸酶作用敏感度增加 染色质DNA受DNase Ⅰ作用通常会被降解成00、400……bp的片段,反映了完整的核小体规则的重复结构。但活跃进行转录的染色质区域受DNase Ⅰ消化常出现100-200bp的DNA片段,且长短不均一,说明其DNA受组蛋白掩盖的结构有变化,出现了对DNase Ⅰ高敏感点(hypersensitive site)。这种高敏感点常出现在转录基因的5′侧区(5′ flanking region)、3′末端或在基因上,多在调控蛋白结合位点的附近,分析该区域核小体的结构发生变化,可能有利于调控蛋白 结合而促进转录。
4.DNA拓扑结构变化 天然双链DNA的构象大多是负性超螺旋。当基因活跃转录时,RNA聚合酶转录方向前方DNA的构象是正性超螺旋,其后面的DNA为负性超螺旋。正性超螺旋会拆散核小体,有利于RNA聚合酶向前移动转录;而负性超螺旋则有利于核小体的再形成。
5.DNA碱基修饰变化 真核DNA中的胞嘧啶约有5%被甲基化为5甲基胞嘧啶(5methylcytidine,m5C),而活跃转录的DNA段落中胞嘧啶甲基化程度常较低。这种甲基化最常发生在某些基因5′侧区的CpG序列中,实验表明这段序列甲基化可使其后的基因不能转录,甲基化可能阻碍转录因子与DNA特定部位的结合从而影响转录。如果用基因打靶的方法除去主要的DNA甲基化酶,小鼠的胚胎就不能正常发育而死亡,可见DNA的甲基化对基因表达调控是重要的。
由此可见,染色质中的基因转录前先要有一个被激活的过程,但目前对激活机制还缺乏认识。
(三)真核基因表达以正性调控为主
真核RNA聚合酶对启动子的亲和力很低,基本上不依靠自身来起始转录,需要依赖多种激活蛋白的协同作用。真核基因调控中虽然也发现有负性调控元件,但其存在并不普遍;真核基因转录表达的调控蛋白也有起阻遏和激活作用或兼有两种作用者,但总的是以激活蛋白的作用为主。即多数真核基因在没有调控蛋白作用时是不转录的,需要表达时就要有激活的蛋白质来促进转录。换言之:真核基因表达以正性调控为主导。
三、真核基因转录水平的调控
真核细胞的三种RNA聚合酶(Ⅰ、Ⅱ和Ⅲ)中,只有RNA聚合酶Ⅱ能转录生成mRNA,以下主要讨论RNA聚合酶Ⅱ的转录调控。
(一)顺式作用元件(cisacting elements)
真核基因的顺式调控元件是基因周围能与特异转录因子结合而影响转录的DNA序列。其中主要是起正性调控作用的顺式作用元件,包括启动子(promoter)、增强子(enhancer);近年又发现起负性调控作用的元件棗沉寂子(silencer)。
1.启动子 与原核启动子的含义相同,是指RNA聚合酶结合并起动转录的DNA序列。但真核同启动子间不像原核那样有明显共同一致的序列,而且单靠RNA聚合酶难以结合DNA而起动转录,而是需要多种蛋白质因子的相互协调作用,不同蛋白质因子又能与不同DNA序列相互作用,不同基因转录起始及其调控所需的蛋白因子也不完全相同,因而不同启动子序列也很不相同,要比原核更复杂、序列也更长。真核启动子一般包括转录起始点及其上游约100-200bp序列,包含有若干具有独立功能的DNA序列元件,每个元件约长7-30bp。最常见的哺乳类RNA聚合酶Ⅱ启动子中的元件序列见表1。
表1 哺乳类RNA聚合酶Ⅱ启动子中常见的元件
元件名称
共同序列
结合的蛋白因子
名称
分子量
结合DNA长度
TATAbox
TATAAAA
TBP
30,000
~10bp
GC box
GGGCGG
SP-1
105,000
~20bp
CAA box
GGCCAATCT
CTF/NF1
60,000
~22bp
Octamer
ATTTGCAT
Oct-1
76,000
~10bp
Oct-2
53,000
~20bp
kB
GGGACTTTCC
NFkB
44,000
~10bp
ATF
GTGACGT
AFT
?
20bp
启动子中的元件可以分为两种:
①核心启动子元件(core promoter element) 指RNA聚合酶起始转录所必需的最小的DNA序列,包括转录起始点及其上游-25/-30bp处的TATA盒。核心元件单独起作用时只能确定转录起始位点和产生基础水平的转录。
②上游启动子元件(upstream promoter element) 包括通常位于-70bp附近的CAAT盒和GC盒、以及距转录起始点更远的上游元件。这些元件与相应的蛋白因子结合能提高或改变转录效率。不同基因具有不同的上游启动子元件,其位置也不相同,这使得不同的基因表达分别有不同的调控。图2以人金属硫蛋白基因为例子,说明真核基因上游启动子元件的组织情况和各元件相应结合的转录因子。
图2 人金属硫蛋白基因的调控区
2.增强子 是一种能够提高转录效率的顺式调控元件,最早是在SV40病毒中发现的长约200bp的一段DNA,可使旁侧的基因转录提高100倍,其后在多种真核生物,甚至在原核生物中都发现了增强子。增强子通常占100-200bp长度,也和启动子一样由若干组件构成,基本核心组件常为8-12bp,可以单拷贝或多拷贝串连形式存在。增强子的作用有以下特点:
①增强子提高同一条DNA链上基因转录效率,可以远距离作用,通常可距离1-4kb、个别情况下离开所调控的基因30kb仍能发挥作用,而且在基因的上游或下游都能起作用。
②增强子作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。而将启动子倒就不能起作用,可见增强子与启动子是很不相同的。
③增强子要有启动子才能发挥作用,没有启动子存在,增强子不能表现活性。但增强子对动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。例如当含有增强子的病毒基因组整合入宿主细胞基因组时,能够增强整合区附近宿主某些基因的转录;当增强子随某些染色体段落移位时,也能提高移到的新位置周围基因的转录。使某些癌基因转录表达增强,可能是肿瘤发生的因素之一。
④增强子的作用机理虽然还不明确,但与其他顺式调控元件一样,必须与特定的蛋白质因结合后才能发挥增强转录的作用。增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性,是由这些细胞或组织中具有的特异性蛋白质因子所决定的。
3.沉寂子 最早在酵母中发现,以后在T淋巴细胞的T抗原受体基因的转录和重排中证实这种负调控顺式元件的存在。目前对这种在基因转录降低或关闭中起作用的序列研究还不多,但从已有的例子看到:沉寂子的作用可不受序列方向的影响,也能远距离发挥作用,并可对异源基因的表达起作用。
(二)反式作用因子(transacting factors)
以反式作用影响转录的因子可统称为转录因子(transcription factors, TF)。RNA聚合酶是一种反式作用于转录的蛋白因子。在真核细胞中RNA聚合酶通常不能单独发挥转录作用,而需要与其他转录因子共同协作。与RNA聚合酶Ⅰ、Ⅱ、Ⅲ相应的转录因子分别称为TFⅠ、TFⅡ、TFⅢ,对TFⅡ研究最多。表2列出真核基因转录需要基本的TFⅡ。
表2 RNA聚合酶Ⅱ的基本转录因子
转录因子
分子量(kD)
功能
TBP
30
与TATA盒结合
TFⅡ-B
33
介导RNA聚合酶Ⅱ的结合
TFⅡ-F
30,74
解旋酶
TFⅡ-E
34,37
ATP酶
TFⅡ-H
62,89
解旋酶
TFⅡ-A
12,19,35
稳定TFⅡ-D的结合
TFⅡ-I
120
促进TFⅡ-D的结合
以前认为与TATA盒结合的蛋白因子是TFⅡ-D,后来发现TFⅡ-D实际包括两类成分:与TATA盒结合的蛋白是TBP(TATAbox binding protein),是唯一能识别TATA盒并与其结合的转录因子,是三种RNA聚合酶转录时都需要的;其他称为TBP相关因子(TBPassociated factors TAF),至少包括8种能与TBP紧密结合的因子。转录前先是TFⅡ-D与TATA盒结合;继而TFⅡ-B以其C端与TBP-DNA复合体结合,其N端则能与RNA聚合酶Ⅱ亲和结合,接着由两个亚基组成的TFⅡ-F加入装配,TFⅡ-F能与RNA聚合酶形成复合体,还具有依赖于ATP供给能量的DNA解旋酶活性,能解开前方的DNA双螺旋,在转录链延伸中起作用。这样,启动子序列就与TFⅡ-D、B、F及RNA聚合酶Ⅱ结合形成一个“最低限度”能有转录功能基础的转录前起始复合物(preintitiation complex, PIC),能转录mRNA。TFⅡ-H是多亚基蛋白复合体,具有依赖于ATP供给能量的DNA解旋酶活性,在转录链延伸中发挥作用;TFⅡ-E是两个亚基组成的四聚体,不直接与DNA结合而可能是与TFⅡ-B联系,能提高ATP酶的活性;TFⅡ-E和TFⅡ-H的加入就形成完整的转录复合体(图3),能转录延伸生成长链RNA,TFⅡ-A能稳定TFⅡ-D与TATA盒的结合,提高转录效率,但不是转录复合体一定需要的。
图3 RNA聚合酶Ⅱ转录复合体的形成示意图
以上所述是典型的启动子上转录复合体的形成,但有的真核启动子不含TATA盒或不通过TATA盒开始转录。例如有的无TATA盒的启动子是靠TFⅡ-I和TFⅡ-D共同组成稳定的转录起始复合体开始转录的。由此可以看到真核转录起始的复杂性。
不同基因由不同的上游启动子元件组成,能与不同的转录因子结合,这些转录因子通过与基础的转录复合体作用而影响转录的效率。现在已经发现有许多不同的转录因子,看到的现象是:同一DNA序列可被不同的蛋白因子所识别;能直接结合DNA序列的蛋白因子是少数,但不同的蛋白因子间可以相互作用,因而多数转录因子是通过蛋白质-蛋白质间作用与DNA序列联系并影响转录效率的(见图4)。转录因子之间或转录因子与DNA的结合都会引起构象的变化,从而影响转录的效率。
图4 转录因子与转录复合体相互作用模式图
图4所示,作为蛋白质的转录因子从功能上分析其结构可包含有不同区域,①DNA结合域(DNA binding domain),多由60-100个氨基酸残基组织的几个亚区组成;②转录激活域(activating domain),常由30-100氨基酸残基组成,这结构域有富含酸性氨基酸、富含谷氨酰胺、富含脯氨酸等不同种类,以酸性结构域最多见;③连接区,即连接上两个结构域的部分。不与DNA直接结合的转录因子没有DNA结合域,但能通过转录激活域直接或间接作用于转录复合体而影响转录效率。
与DNA结合的转录因子大多以二聚体形式起作用,与DNA结合的功能域常见有以下几种:
图5 HTH结构及其与DNA的结合
①螺旋转角螺旋(helixturnhelix, HTH)及螺旋-环-螺旋(helixloophelix,HLH) 这类结构至少有两个α螺旋,其间由短肽段形成的转角或环连接,两个这样的motif结构以二聚体形式相连,距离正好相当于DNA一个螺距(3.4nm),两个α螺旋刚好分别嵌入DNA的深沟(图5)。
图6 蛋白质的锌指结构
②锌指(zinc finger) 其结构如图6所示,每个重复的“指”状结构约含23个氨基酸残基,锌以4个配价键与4个半胱氨酸、或2个半胱氨酸和2个组氨酸相结合。整个蛋白质分子可有2?个这样的锌指重复单位。每一个单位可以其指部伸入DNA双螺旋的深沟,接触5个核苷酸。例如与GC盒结合的转录因子SP1中就有连续的3个锌指重复结构。
③碱性-亮氨酸拉链(basic leucine zipper, bZIP),该结构的特点是蛋白质分子的肽链上每隔6个氨基酸就有一个亮氨酸残基,结果就导致这些亮氨酸残基都在α螺旋的同一个方向出现。两个相同结构的两排亮氨酸残基就能以疏水键结合成二聚体,该二聚体的另一端的肽段富含碱性氨基酸残基,借其正电荷与DNA双螺旋链上带负电荷的磷酸基团结合。若不形成二聚体则对DNA的亲和结合力明显降低。在肝脏、小肠上皮、脂肪细胞和某些脑细胞中有称为C/EBP家族的一大类蛋白质能够与CAAT盒和病毒增强子结合,其特征就是能形成bZIP二聚体结构。
图7 碱性亮氨酸拉链结构及其与DNA的结合
从上述可见:转录调控的实质在于蛋白质与DNA、蛋白质与蛋白质之间的相互作用,构象的变化正是蛋白质和核酸“活”的表现。但对生物大分子间的辨认、相互作用、结构上的变化及其在生命活动中的意义,人们的认识和研究还只在起步阶段,其中许多内容甚至重要的规律我们可能至今还一无所知,有待于努力探索。
本 章 提 要
基因表达是基因经过一系列步骤表现出其生物功能的整个过程,是受着严密、精确调控的。基因组含有生物体生存、发育、活动和繁殖所需要的全部遗传信息,但这些遗传信息并不同时全部都表达出来。不同的组织细胞、细胞分化发育不同时期,基因表达的种类和强度各不相同,决定着细胞的形态和功能;生物体能适应环境变化改变自身的基因表达以利生存,因而基因表达调控也是生命本质之所在。某些基因表达不大受环境影响,称为组成性表达;其中某些基因表达产物是细胞或生物体整个生命过程中都持续需要而必不可少的,这类基因称为看家基因。另一类基因表达易随环境信号而变化,称为适应性表达。环境变化,使基因表达水平提高者称为诱导,使基因表达水平降低者称为阻遏。
基因表达调控可以在复制、扩增、基因激活、转录、转录后、翻译和翻译后等多级水平上行,但mRNA转录起始是基因表达调控的基本控制点。转录起始调控的实质是DNA-蛋白质/蛋白质蛋白质间的相互作用对RNA聚合酶活性的影响。调控结果使基因表达水平提高的称为正性调控(上调),使基因表达水平降低者为负性调控(下调)。在同一条核酸链上起调控基因表达作用的核酸序列称为顺式作用元件;能对不同核酸链上的基因表达起调控作用的蛋白质称反式作用因子或转录因子。核酸链上的顺式作用元件与反式作用蛋白因子相互作用而调控基因表达。
多数原核生物的基因按功能相关性串连排列共同组成一个转录调控单位棗操纵元。第一个阐明的操纵元是1ac操纵元。操纵元最基本的组成元件有:受调控的结构基因群、启动子、操纵子、调控基因和终止子。有的操纵元还含有衰减子。在同一启动子控制下,从结构基因群转录合成多顺反子mRNA,实现协调表达。由调控基因编码合成的调控蛋白作用于操纵子序列,起到阻遏基因表达作用的称阻遏蛋白,起促进基因表达者为激活蛋白。调控蛋白可受特定的小分子作用发生变构而改变其对操纵子的作用,这是许多原核基因适应内外环境变化,改变表达水平的机理所在。
真核基因组比原核大得多,结构更复杂,含有许多重复序列,基因组的大部分序列不是为蛋白质编码的,而为蛋白质编码的基因绝大多数是不连续的。真核生物基本上是采取逐个基因调控表达的形式。真核基因表达调控的环节更多,转录前可以有基因的扩增或重排,并涉及染色质结构的改变、基因激活过程。转录后调控的方式也很多,但仍以转录起始调控为主。正性调控是真核基因调控的主导方面,RNA聚合酶的转录活性依赖于基本转录因子,在转录前先形成转录复合体,其转录效率受许多蛋白因子的影响,协调表达更为复杂。目前对真核基因表达调控的认识和研究还只处在初级阶段。
基因重组与基因工程--工具酶
DNA重组与基因工程
DNA Recombination and Genetic engineering
基因工程(genetic engineering)和遗传工程的英语中是同一个词汇。从字面上看,遗传工程就是按人们的意思去改造生物的遗传特性、或创建具有新遗传物性的生物。遗传是由基因决定的,改建生物的遗传性,就是改建生物的基因,因此狭义的遗传工程就是基因工程。
对多数生物来说,基因本质是DNA,基因工程就是要改建DNA,涉及DNA序列的重新组合和建造,所以基因工程的核心就是人工的DNA重组(DNA recombination)。
图1 基本工程的基本程序
重组、建造的DNA分子只有纯化繁殖才有意义。纯的无性繁殖系统称为克隆。纯化繁殖DNA就称为DNA克隆或分子克隆,基因的纯化繁殖就称为基因克隆。所以DNA重组和分子克隆是与基因工程密切不可分的,是基因工程技术的核心和主要组成部分。重组DNA、分子克隆甚至成了基因工程的代名词。
只有当人类对遗传现象本质和规律有深入的认识,才能按人类的意志去改造或创建生物的遗传特性。20世纪50-60年代分子遗传学的迅速发展,确定了主要遗传物质DNA的双螺旋结构、阐明了遗传信息传递的中心法则、破译了遗传密码,为基因工程奠定了理论基础;同时酶学、细菌学、病毒学的发展,为基因工程提供了必要的工具。1972-1973年Boyer、Cohn和Berg等创立了DNA克隆技术,打破了种属的界限,第一次使本来只存在于真核细胞中的蛋白质能够在大肠杆菌中合成,这是基因工程诞生的里程碑。科学界公认基因工程的出现是20世纪最重要的科学成就这一。标志人类主动改造生物界的能力进入新的阶段。分子生物学的成就是DNA重组技术和基因工程出现和发展的基础,而DNA重组技术和基因工程的发展又有力地推动着分子生物学的进步。
基因工程属于生物技术范畴,生物技术(biotechnology)不是一个独立的学科而是一套技术或手段。广义的生物技术指任何利用活的生物体或其一部分生产产品或改良生物品质的技术;狭义的生物技术是专指以DNA重组技术和单克隆技术为标志发展起来的新技术。如无特别说明,通常生物技术一词就专指新的生物技术而言。一般认为这新的生物技术包括基因工程、细胞工程、酶工程和发酵工程几方面的内容。基因工程是生物技术的核心和关键,是主导技术;细胞技术是生物技术的基础;酶工程是生物技术的条件;发酵工程是生物技术获得最终产品的手段,四个方面相互联系的。生物技术是一个综合技术体系,其中基因工程和细胞融合技术最为突出。蛋白质工程(protein engineering)则是在基因工程基础上综合蛋白质化学、蛋白质晶体学、计算机学辅助设计等知识和技术发展起来的研究新领域,开创了按人类意愿设计和研制人类需要的蛋白质的新时期,被称为第二代基因工程。
基因工程的基本程序见图1所示。
第一节 工具酶
DNA重组技术中对核酸的“精雕细刻”主要用酶作为工具。分子生物学研究过程中发现的酶,许多都用作工具,表列出最常用的几种工具酶。限制性核酸内切酶(restriction endonuclease)在重组DNA技术中有重要地位,在此较详细介绍。
一、限制性核酸内切酶的概念
核酸酶可分为两类:核酸外切酶(exonuclease)是从核酸的一端开始,一个接一个把核苷酸水解下来;核酸内切酶(endonuclease)则从核酸链中间水解3’,5’磷酸二酯键,将核酸链切断。很多细菌和细胞中都能识别外来的核酸并将其分解,1962年发现这是因为细菌中含有特异的核酸内切酶,能识别特定的核酸序列而将核酸切断;同时又伴随有特定的核酸修饰酶,最常见的是甲基化酶,能使细胞自身核酸特定的序列上碱基甲基化,从而避免受内切酶水解,外来核酸没有这种特异的甲基化修饰,就会被细胞的核酸酶所水解.这样细胞就构成了限制一修饰体系,其功能就是保护自身的DNA,分解外来的DNA,以保护和维持自身遗传信息的稳定,这对细菌的生存和繁衍具有重要意义。这就是限制性核酸内切酶名称中“限制”二字概念的由来。
二、限制性核酸内切酶的命名
按酶的来源的属、种名而定,取属名的第一个字母与种名的头两个字母组成的三个斜体字母作略语表示;如有株名,再加上一个字母,其后再按发现的先后写上罗马数字。例如:从流感嗜血杆菌d株(Haemophilus influenzae d)中先后分离到3种限制酶,则分别命名为HindⅠ、HindⅡ和HindⅢ。
三、限制性核酸内切酶的分类
按限制酶的组成、与修饰酶活性关系,切断核酸的情况不同,分为三类:
Ⅰ类限制性核酸内切酶? 由3种不同亚基构成,兼具有修饰酶活性和依赖于ATP的限制性内切酶活性,它能识别和结合于特定的DNA序列位点,去随机切断在识别位点以外的DNA序列,通常在识别位点周围400-700bp。这类酶的作用需要Mg2+,S腺苷甲硫氨酸及ATP。
Ⅱ类限制性核酸内切酶? 与Ⅰ类酶相似,是多亚蛋白质,既有内切酶活性,又有修饰酶活性,切断位点在识别序列周围25-30bp范围内,酶促反应除Mg2+外,也需要ATP供给能量。
Ⅲ类限制性核酸内切酶 只由一条肽链构成,仅需Mg2+,切割DNA特异性最强,且就在识别位点范围内切断DNA。是分子生物学中应用最广的限制性内切酶。通常在重组DNA技术提到的限制性核酸内切酶主要指Ⅱ类酶而言。
??? 表1 DNA重组技术中最常用的工具酶
酶
主要用途
限制性核酸内切酶
识别DNA特定序列,切断DNA链
DNA聚合酶Ⅰ
或其大片段(Klenow)
①缺口平移制作标记DNA探针
②合成cDNA的第二链
③填补双链DNA3’凹端
④DNA序列分析
耐热DNA聚合酶(Taq DNA聚合酶等)
聚合酶链反应(PCR)
DNA连接酶
连接两个DNA分子或片段
多核苷酸激酶
催化多核苷酸5’羟基末端磷酸化,制备末端标记探针
末端转移酶
在3’末端加入同质多聚物尾
SI核酸酶,绿豆核酸酶
降解单链DNA或RNA,使双链DNA突出端变为平端
DNA端酶Ⅰ
降解DNA,在双链DNA上产生随机切口
RNA酶A
降解除RNA
磷酸酶
切除核酸末端磷酸基
四、限制性核酸内切酶的作用
大部分限制性核酸内切酶识别DNA序列具有回文结构特征,切断的双链DNA都产生5’磷酸基和3’羟基末端。不同限制性核酸内切酶识别和切割的特异性不同,结果有三种不同的情况:
①产生3’突出粘性末端(cohesive end):以EooR 为例:
5’…G↓AATT C…3’→5’…Gp?? OHTTAAC…3’
3’…C ATAA↑G…5’EooP Ⅰ 3'…??? CTTAAOH?? pG…5'
②产生5’突出的粘性末端:以PstⅠ为例:
5’…CTGCA↓G…3’→5’…CTGCAp? OHG…3’
3’…G↑ACGTC…5’PstⅠ 3’…GOH? pACGTC…5
③产生平末端(blunt end):Nru Ⅰ为例:
5’…TCG↓CGA…3’→5’…TCGp OHCGA…3’
3’…AGC↑GCT…5’Nru Ⅰ3’…AGCOH pGCT…5’
不同有限制性核酸内切酶识别的DNA序列可以不相同。有的识别四核苷酸序列,有的识别六或八核苷酸序列。如果DNA中的核苷酸序列是随机排列的,则一个识别四核苷酸序列的内切酶平均每隔256bp出现一次该酶的识别切割位点,同样的对识别六或八核苷酸序列的内切酶则大致上分别是每隔4kb或65kb出现一次识别切割位点。按此可大致估计一个未知的DNA分子限制性内切酶可能具有切点频率,以便选用合适的内切酶。
限制性核酸内切酶的种类很多,至今已发现近800多种,可以根据它们对DNA有不同的识别序列和切割特征选用,从而为基因工程提供了有力的工具。表2列出了几种最常用的限制性核酸内切酶的识别序列和切割点。
??? 表2 几种最常用的限制性核酸内切酶
限制性核酸内切酶名称
识别序列和切割点
BamHⅠ
Cla Ⅰ
EooR Ⅰ
Hind Ⅲ
HindⅡ
KpnⅠ
Not Ⅰ
Pst Ⅰ
Sal Ⅰ
Sau3A Ⅰ
Sfi Ⅰ
Sma Ⅰ
Xba Ⅰ
Xho Ⅰ
G↓GATCC
AT↓CGAT
G↓AATTC
A↓AGCTT
GTPy↓PuAC
GGTAC↓C
GC↓GGCCGC
CTGCA↓G
G↓TCGAC
↓GATC
GGCCNNNN↓NGGCC
CCC↓GGG
T↓CTAGA
C↓TCGAG
基因工程载体
基因工程是要按人们的意愿去有目的地改造,创建生物遗传性,因此其最基本的工程就是要得到目的基因或核酸序列的克隆。分离或改建的基因和核酸序列自身不能繁殖,需要载体携带它们到合适的细胞中复制和表现功能。对理想的基因工程载体一般至少有以下几点要求:
①能在宿主细胞中复制繁殖,而且最好要有较高的自主复制能力。
②容易进入宿主细胞,而且进入效率越高越好。
③容易插入外来核酸片段,插入后不影响其进入宿主细胞和在细胞中的复制。这就要求载体DNA上要有合适的限制性核酸内切酶位点。
④容易从宿主细胞中分离纯化出来, 这才便于重组操作。
⑤有容易被识别筛选的标志,当其进入宿主细胞、或携带着外来的核酸序列进入宿主细胞都能容易被辨认和分离出来。这才介于克隆操作。
常用的载体有质粒,噬菌体和病毒等。
一、质粒载体
质粒(plasmid)是细菌或细胞染色质以外的,能自主复制的,与细菌或细胞共生的遗传成分。其特点如下:
①是染色质外的双链共价闭合环形DNA(covalently closed circuar DNA,cccDNA),可自然形成超螺旋结构,不同质粒大小在2-300 kb之间,<15kb的小质粒比较容易分离纯化,>15kb的大质粒则不易提取。
②能自主复制,是能独立复制的复制子(autonomous replicon)。一般质粒DNA复制的质粒可随宿主细胞分裂而传给后代。按质粒复制的调控及其拷贝数可分两类:严紧控制(stringent control)型质粒的复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有1个到十几个拷贝;另一类是松弛控制(relaxed control)型质粒,其复制宿主不偶联,每个细胞中有几十到几百个拷贝。每个质粒DNA上都有复制的起点,只有ori能被宿主细胞复制蛋白质识别的质粒才能在该种细胞中复制,不同质粒复制控制状况主要与复制起点的序列结构相关。有的质粒的可以整合到宿主细胞染色质DNA中,随宿主DNA复制,称为附加体,例如细菌的性质粒就是一种附加体,它可以质粒形式存在,也能整合入细菌的DNA,又能从细菌染色质DNA上切下来。F因子携带基因编码的蛋白质能使两个细菌间形成纤毛状细管连接的接合(conjugation),通过这细管遗传物质可在两个细菌间传递。
③质粒对宿主生存并不是必需的。这点不同于线粒体,线粒体DNA也是环状双链分子,也有独立复制的调控,但线粒体的功能是细胞生存所必需的。线粒体是细胞的一部分,质粒也往往有其表型,其表现不是宿主生存所必需的,但也不妨碍宿主的生存。某些质粒携带的基因功能有利于宿主细胞的特定条件下生存,例如,细菌中许多天然的质粒带有抗药性基因,如编码合成能分解破坏四环素、氯霉素、氨芐表霉素等的酶基因,这种质粒称为抗药性质粒,又称R质粒,带有R质粒的细菌就能在相应的抗生素存在生存繁殖。所以质粒对宿主不是寄生的,而是共生的。医学上遇到许多细菌的抗药性,常与R质粒在细菌间的传播有关,F质粒就能促使这种传递。
??
图1 pBR322及pUC18图谱
现在分子生物学使用的质粒载体都已不是原来细菌或细胞中天然存在的质粒,而是经过了许多的人工的改造。从不同的实验目的出发,人们设计了各种不同的类型的质粒载体,近年来发展很快,新的有特定用途的质粒不断被创建。图1给出最常用的大肠杆菌克隆用质粒pUC19的图谱,此质粒的复制起点处序列经过改造,能高频率起动质粒复制,使一个细菌pUC19的拷贝数可达500-700个;质粒携带一个抗氨芐青霉素基因,编码能水解β-内酰胺环,从而被坏氨芐青霉素的酶,当用pUC19转化细菌后放入含氨芐青霉素的培养基中,凡不含pUC19者都不能生长,结果长出的细菌就是都含有pUC19的;pUC19还携带细菌lac操纵元中的lacI和lacZ基因编码,β-半乳糖苷酶N端状146个氨基酸的段落,当培养基中含有诱导物IPTG和Xgal时,lacZ ' 基因被诱导表达产生的β-半乳糖苷酶N端肽与宿主菌表达的C端肽互补而具有β-半乳糖苷酶活性(质粒和宿主编码的肽段各自都没有酶活性,两都融为一体而具酶活性,称为α-互补,α-complementation),半乳糖苷酶水解Xgal而使菌落呈现蓝色;在lacZ '中间又插入了一段人工设计合成的DNA序列,其中密集多个常用的限制性核酸内切酶的位点,使外来的基因和序列能很方便地被插入此位置,当外来序列插入后则破坏了lacZ '编码的半乳糖苷酶活性,生长的菌落就呈白色,这种颜色标志的变化就很容易区分和挑选含有和不含有插入序列或基因的转化菌落,称为蓝白筛选法。
除常用的大肠杆菌质粒载体外,近年来发展了许多人工构建的其它能用于微生物、酵母、植物等的质粒载体。含有不止一个ori、能携带插入序列在不同种类宿主细胞中繁殖的载体称为穿梭载体(shuttle vectors)。
二、噬菌体载体
噬菌体(phage)是感染细菌的一类病毒,有的噬菌体基因组较大,加入λ噬菌和T噬菌体等;有的则较小,如M13、f1、fd噬菌体等。用感染大肠杆菌的λ噬菌体改造成的载体应用最为广泛。
λ噬菌体由头和尾构成,其基因组是长约49kb的线性双链DNA分子,组装在头部蛋白质外壳内部,其序列已被全部测出。λ噬菌体感染时,通过尾管将基因组DNA注入大肠杆菌,而将其蛋白质外壳留在菌外。DNA进入大肠杆菌后以其两端12bp的互补单链粘末端环化成环状双链,可以两种不同的方式繁殖(图2):①溶菌性方式(lytic pathway):在营养充足,条件适合细菌繁殖时,利用宿主菌中的酶类和原料,λDNA上基因可按调控的顺序表达合成构成噬菌体头、尾和尾丝所需的各种蛋白质,λDNA经多次复制合成许多子代λDNA,于是装配成许多子代的λ噬菌体,最后裂菌,释放出许多新的λ噬菌体。②溶原性方式(lysogenic pathway):进入细菌的λDNA可整合(integrate)入细菌的染色质DNA中,随细菌染色体DNA复制,传给细菌后代,这个稳定潜伏在细菌染色质DNA中的λDNA称为原噬菌体(prophage),含有原噬菌体的细菌称为溶源菌(lysogen)。λDNA的整合是可逆的,原噬菌体可从宿主DNA中切出,进入溶菌性方式的繁殖。
???图2 λ噬菌体的溶菌和溶原繁殖方式
λ噬菌体整个基因组如图3所示,可分为三个部分,①左臂:从A到J长约20kb,其中的基因编码构成头部、尾部、尾丝对组装完整噬菌体所需要的蛋白质。②中段:长约20kb,是λDNA整合和切出,溶原生长所需的序列。③右臂:长约10kb,是调控区,控制溶菌和溶原生长最重要的调控基因和序列、以及λDNA复制起始均在这区域内。左右臂包含λDNA复制、噬菌体结构蛋白合成、组装成熟噬菌体、溶菌生长所需全部序列;对溶菌生长来说,中段是非必需的。
利用λ噬菌体作载体,主要是将外来目的DNA替代或插入中段序列,使其随左右臂一起包装成噬菌体,去感染大肠杆菌,并随噬菌体的溶菌繁殖而繁殖。现在广泛使用的λ噬菌体载体也是已作过许多人工改造的,主要的改造是:①设计去除λDNA上的一些限制性酶切点。这是因为λDNA较大,序列中的限制性酶切点过多,妨碍其应用。②在中段非必需区,替换插入某些标志基因如上述的可供蓝白筛选lacI-lacZ’序列,和多克隆位点等。由此可构建出两类λ噬菌体作载体;一类是插入型载体,可将外来序列插中段,常用的λgt系列载体,一般容许插入5-7kb外来DNA;另一类是转换型载体,即可用外来DNA替代中段,如IMBL系列载体。
图3 野生型λ噬菌体DNA及相应的λ噬菌体DNA图谱
插入或置换中段外来的DNA长度是有一定限制的,当噬菌体DNA长度大于野生型λ噬菌体基因组105%或小于78%时,包装而成的噬菌体存活力显著下降。所以λ噬菌体载体可插入长5-20kb的外来DNA,这比质粒载体能插入的DNA长得多;而且包装的λ噬菌体感染大肠杆菌要比质粒转化细菌的效率高得多,所以λ噬菌体载体常用于构建cDNA文库或基因组文库。但λ噬菌体载体的克隆操作要比质粒载体复杂。
如果将左右臂和中段都去除,仅留下λDNA而端包装噬菌体所必需的cos序列,再加上质粒的复制序列、标志基因、多克隆位点等,就可构成cos质粒或称为粘粒的载体。粘粒可插入45kb长的外源DNA,然后用λ噬菌体外壳蛋白包装成噬菌体,感染大肠杆菌后,粘粒的DNA能以质粒的形式在细菌中繁殖而被克隆。所以粘粒主要用于DNA文库的构建。
三、动物病毒载体
质粒和噬菌体载体只能在细菌中繁殖,不能满足真核DNA重组需要。感染动物的病毒可改造用作动物细胞的载体。由于动物细胞的培养和操作较复杂、花费也较多,因而病毒载体构建时一般都把细菌质粒复制起始序列放置其中。使载体及其携带的外来序列能方便地在细菌中繁殖和克隆,然后再引入真核细胞。目前病毒载体常用者有改造来自猴肾病毒SV40(Simian Virus 40)、逆转录病毒和昆虫杆状病毒等,使用这些病毒载体的目的多为将目的基因或序列放入动物细胞中表达或试验其功能、或作基因治疗等(见后)。
人基因组十分庞大,约含4×109bp,建立和筛选人的基因组文库,要求有容量更大的载体,酵母人工染色体(yeast artificial chromosome,YAC)载体应运而生。YAC含有酵母染色体端粒(telesome)、着丝点(centromere)及复制起点等功能序列,可插入长度达200-500kb的外源DNA,导入酵母细胞可以随细胞分裂周期复制繁殖供作克隆,成为人基因组研究计划的重要
目的序列与载体的连接
将目的基因或序列插入载体,主要靠DNA连接酶和双链DNA粘末端单链序列互补结合的配合使用。有以下主要的方式。
一、粘性末端连接
如果目的序列两端有与载体上相同的限制性核酸内切酶位点,则同一限制酶切开产生的粘末端,在降低温度退火时,能重新互补结合,在DNA连接酶催化下,目的序列就与载体DNA链相连接(见图1)。
图1 同一限制酶切割DNA粘性末端的连接
不同的限制性内切酶切,如果产生的DNA的粘末端相同,也同样可用此法连接,如识别6bp序列的BamHⅠ和识别4bp序列的Sau3aⅠ切割DNA后都产生5’突出粘性末端GATC,可以互补结合连接。
如果在连接的两个DNA片段没有能互补的粘性末端,可用末湍核苷酸转移酶催化脱氨单核苷酸添加DNA的3’末端,例如一般DNA3’端加上polyG,另一股DNA加上polyC,这样人工在DNA两端做出能互补的共核苷酸多聚物粘性末端,退炎后能结合连接(图2),这样方法称为同聚物加尾法。
图2 同聚物加尾连拉法
对平末端的DNA,也可先连上人工设计合成的脱氧寡核苷酸双链接头,使DNA末端产生新的限制内切酶位点,经内切酶割后,即可按粘性末端相连(图3)。
图3 人工接头连接法
二、平末端连接
T4DNA连接酶也能催化限制性内切酶切割产生DNA平末端的连接。如果目的序列和载体上没有相同的限制性内切酶位点可供利用,用不同的限制性内切酶切割后的粘性末端不能互补结合,则可用适当的酶将DNA突出的末端削平或补齐成平末端,再用T4DNA连接酶连接,但平末端连接要比粘性末端连接的效率低得多。
目的基因序列的来源和分离
一、基因组DNA文库
从生物组织细胞提取出全部DNA,用物理方法(超声波、搅拌剪力等)或酶法(限制性核酸内切酶的不完全酶解)将DNA降解成预期大小的片段,然后将这些片段与适当的载体(常用噬菌体、粘粒或YAC载体)连接,转入受体细菌或细胞,这样每一个细胞接受了含有一个基因组DNA片段与载体连接的重组DNA分子,而且可以繁殖扩增,许多细胞一起组成一个含有基因组各DNA片段克隆的集合体,就称为基因组DNA文库(genomic DNA library)。如果这个文库足够大,能包含该生物基因组DNA全部的序列,就是该生物完整的基因组文库,能从这文库中钓取该生物的全部基因或DNA序列。从基因组含有生物生存、活动和繁殖的全部遗传信息的概念出发,基因组文库是具有生物种属特异性的。
构建基因组文库,再用分子杂交等技术去钓取基因克隆的方法,称为鸟枪法或散弹射击法,意味着从含有众多的基因序列克隆群中去获取目的基因或序列。当生物基因组比较小时,此法较易成功;当生物基因组很大时,构建其完整的基因组文库就非易事,从庞大的文库中去克隆目的基因工程量也很大。
图1 基因组DNA文库的构建
二、cDNA文库
以mRNA为模板,经反转录酶催化合成DNA,则此DNA序列与mRNA互补,称为互补DNA或cDNA。提取出组织细胞的全部mRNA,在体外反转录成cDNA,与适当的载体常用噬菌体或质粒载体连接后转化受体菌,则每个细菌含有一段cDNA,并能繁殖扩增,这样包含着细胞全部mRNA信息的cDNA克隆集合称为该组织细胞的cDNA文库,基因组含有的基因在特定的组织细胞中只有一部分表达,而且处在不同环境条件、不同分化时期的细胞其基因表达的种类和强度也不尽相同,所以cDNA文库具有组织细胞特异性。cDNA文库显然比基因组DNA文库小得多,能够比较容易从中筛选克隆得细胞特异表达的基因。但对真核细胞来说,从基因组DNA文库获得的基因与从cDNA文库获得的不同,基因组DNA文库所含的是带有含子和外显子的基因组基因,而从cDNA文库中获得的是已经过剪接、去除了内含子的cDNA。
图2 cDNA文库的构建
三、聚合酶链式反应(PCR)
如果已经知道目的基因的序列,就能很方便地用PCR聚合酶链式反应,polymerase chain reaction,从基因组DNA或cDNA中获得目的基因,可不必要经过复杂的DNA文库构建过程。PCR是70年代中期创立的技术,其基本原理如图3所示。
图3 PCR基本原理示意图
PCR反应系统包括含有目的基因或序列的DNA模板,对热稳定的DNA聚合酶,一对脱氧寡核苷酸引物、DNA合成所需要的4种脱氧核苷三磷酸以及保证聚合酶催化反应的Mg2+及缓冲液等。人工合成引物的序列设计是PCR成功的关键,一般两条引物的序列反应分别与欲获得的双链DNA两条链3’端的序列互补。先升高温度使模板DNA变性、双链分开;再降低温度退火使引物与模板DNA配对互补结合;然后升温到聚合酶反应适宜的温度,此时在聚合酶催化下,从引物3’羟基端开始,与模板DNA上的碱基配对逐个加上核苷酸,合成新的DNA链。其后再按高温变性、低温退火、适温合成三步反复循环,新合成的DNA在下一循环中又作为模板使用,每循环一次,合成的目的序列扩增一倍,而且很快扩增的序列主要限制在所设计的一对引物规定的模板序列范围内,一般循环30-40次,按理论计算,目的序列可扩增230-240倍,而实际上由于底物和引物的消耗,酶的失活等因素,产物量并不是始终以指数增加的,但通常实验获得目的序列106-108倍的扩增产物并不困难,因而PCR具有很高度的灵敏度,由于引物与模板的配对互补结合的特异的,因而PCR也具有高度的特异性。所以可以方便地用PCR在成千上万的基因序列中获得只有极微含量的特定目的基因或序列,PCR获得的目的序列产物连接在适当的载体上,转化受体细胞,经筛选就能得到目的序列的克隆。
现在PCR技术还在不断发展,已知部分序列或未知序列的基因有的也能设计PCR来扩增和克隆,模板核酸可用双链DNA,单链DNA,甚至RNA。由于PCR的高灵敏度和特异性,在基因诊断上有更广泛的应用,后面的章节还要叙述。
四、人工化学合成
随化学合成技术的发展,现在计算机控制的全自动核酸合成仪已被广泛应用,按人们设计好的序列一次合成100-200bp长的DNA片段已不成问题。可能用这些合成的片段组合连接成完整的基因。但目前人工合成基因最大的限制是人们并未掌握怎样的核酸序列能具有生命功能的规律,例如1kb长的DNA最通常编码功能蛋白质的基因长度就可以有~10600种不同的序列,随意合成的DNA绝大多数肯定是不具有生物功能或无法知道它会有什么功能的,因而只能模仿自然界生物中已知的基因序列来合成,而化学合成这样长的基因DNA序列,其价格远高于用PCR法获得基因,所以目前很少全部用化学方法去合成基因。但人工设计化学合成核酸片段作为引物、接头等已经是分子生物学和基因工程中必不可少的、十分重要的手段。
基因序列导入细胞
目的基因序列与载体连接后,要导入细胞中才能繁殖扩增,再经过筛选,才能获得重组DNA分子克隆,不同的载体在不同的宿主细胞中繁殖,导入细胞的方法也不相同。
一、转化
由于外源DNA的进入而使细胞遗传性改变称为转化,早在1943年,Avery等就发现有毒肺炎双球菌的DNA与无毒肺炎双球菌共培养后产生有毒性的肺炎双球菌后代的转化现象。但DNA进入细胞的效率很低,在分子生物学和基因工程工作中可采取一些方法处理细胞,经处理后的细胞就容易接受外界DNA,称为感受态细胞,再与外源DNA接触,就能提高转化效率。例如大肠杆菌经冰冷CaCl2的处理,就成为感受态细菌,当加入重组质粒并突然由4℃转入42℃作短时间处理,质粒DNA就能进入细菌;用高电压脉冲短暂作用于细菌也能显著提高转化效率,这称为电穿孔(electroporation)转化法。
二、感染
噬菌体进入宿主细菌,病毒进入宿主细胞中繁殖就是感染(infection)。用经人工改造的噬菌体活病毒作载体,以其DNA与目的序列重组后,在体外用噬菌体或病毒的外壳蛋白将重组DNA包装成有活力的噬菌体或病毒,就能以感染的方式进入宿主细菌或细胞,使目的序列得以复制繁殖。感染的效率很高,但DNA包装成噬菌体或病毒的操作较麻烦。
三、转染
重组的噬菌体DNA也可象质粒DNA的方式进入宿主菌,即宿主菌先经过CaCl2,电穿孔等处理成感受态细菌再接受DNA,进入感受态细菌的噬菌体DNA可以同样复制和繁殖,这种方式称为转染(transfection)。M13噬菌体DNA导入大肠杆菌就常用转染的方法。重组DNA进入宿主细胞也常用转染方式。最经典的是1973年建立的磷酸钙法,其利用的基本现象是:DNA如以磷酸钙-DNA共沉淀物形式出现时,培养细胞摄取DNA的效率会显著提高。用电穿孔法处理培养的哺乳类细胞也能提高细胞摄取DNA能力,但所用外加电场的强度、电脉冲的长度等条件与处理细菌者都很不相同。近年来用人工脂质膜包裹DNA,形成的脂质体(Liposome)可以通过与细胞膜融合而将DNA导入细胞,方法简单而有效,现有商售的脂质体试剂,使用日益广泛。
目的基因序列克隆的筛选与鉴定
目的序列与载体DNA正确连接的效率、重组导入细胞的效率都不是百分之百的,因而最后生长繁殖出来的细胞并不同都带有目的序列。一般一个载体只携带某一段外源DNA,一个细胞只接受一个重组DNA分子。最后培养出来的细胞群中只有一部分、甚至只有很小一部分是含有目的序列的重组体(recombinant)。将目的重组体筛选出来就等于获得了目的序列的克隆,所以筛选(dcreening)是基因克隆的重要步骤。在构建载体,选择宿主细胞、设计分子克隆方案时都必须仔细考虑筛选的问题。以下就常用技术的基本原理加以介绍。
一、根据重组载体的标志作筛选
最常见的载体携带的标志是抗药性标志,如抗氨芐青霉素(anpr)、抗四环素(terr)、抗卡那霉素(kanr)等。当培养基中含有抗生素时,只有携带相应抗药性基因载体的细胞才能生存繁殖,这就把凡未能接受载体DNA的细胞全部筛除掉了。如果外源目的序列是插入在载体的抗药性基因中间使这抗药性基因失活,这个抗药性标志就会消失。例如质粒pBR322含有anpr、和terr两个抗药基因,若将目的序列插入terr基因序列中,转化大肠杆菌,让细菌放在含氨芐青霉素或四环素培养基中,凡未接受质粒DNA的细胞都不能生长;凡在含氨芐青霉素和四环素中都能生长的细菌是含有质粒pBR322的,但其pBR322未插入目的序列,凡在氨芐青霉素中能生长、而在四环素中不能生长的细菌就很可能是含有目的序列的重组质粒。
载体含有lacZ’的蓝白筛选法,近年更被广泛应用。例如将目的序列插入前面述及的质粒pUC19的多克隆位点,转化大肠杆菌,放入含氨芐青霉素、IPTG、X-gal的培养基中培养,凡能生长并呈白色的菌落,其细菌中就很可能含有插入目的序列的重组质粒,这样就很容易获得目的序列的克隆。
根据重组载体的标志来筛选,可以筛选去大量的非目的重组体,但还只是粗筛,例如细菌可能发生变异而引起抗药性的改变,却并不代表目的序列的插入,所以需要做进一步细致的筛选。
二、核酸杂交法
利用标记的核酸做探针与转化细胞的DNA进行分子杂交,可以直接筛选和鉴定目的序列克隆。常用的方法是将转化后生长的菌落复印到硝酸纤维膜上,用碱裂菌,菌落释放的DNA就吸附在膜上,再与标记的核酸探针温育杂交,核酸探针就结合在含有目的序列的菌落DNA上而不被洗脱。核酸探针可以用放射性核素标记,结合了放射性核酸探针的菌落集团可用放射性自显影(auroradiography)法指示出来,核酸探针也可以用非放射性物质标记,通常是经颜色呈现指示位置,这样就可以将含有目的序列的菌落挑选出来。
三、PCR法
PCR技术的出现给克隆的筛选增加了一个新手段。如果已知目的序列的长度和两端的序列,则可以设计合成一对引物,以转化细胞所得的DNA为模板进行扩增,若能得到预期长度的PCR产物,则该转化细胞就可能含有目的的序列。
四、免疫学方
利用特定抗体与目的基因表达产物特异性结合的作用进行筛选。此法不是直接筛选目的基因,而是通过与基因表达产物的反应指示含有目的基因的转化细胞,因而要求实验设计要使目的基因进入受体细胞后能够表达出其编码产物。抗体可用特定的酶常用过氧化物酶、碱性磷酸酶等标记,结合酶标抗体处,酶可催化特定的底物分解而呈现颜色,从而指示出含有目的的基因的细胞集落位置。免疫学方法特异性强、灵敏度高,适用于从大量转化细胞集合体中筛选很少几个含目的基因的细胞克隆。
五、DNA限制性内切酶图谱分析
这是在上述筛选后的进一步分析。目的序列插入载体会使载体DNA限制性酶图谱(restriction map)发生变化,例如一个长600bp的目的序列利用它两端的EooR I和SalI切后的粘末端连接插入pUC19的多克隆点,则重组质粒就增大为3.3kb,用EooR I和SalI双酶切后会出现600bp和-2.7kb两个DNA片段,提取转化细菌的质粒DNA作酶切后做电泳观察其酶切图谱,就能分析得结果;如插入的目的序列中有其它限制性内切酶位点,也能在酶切电泳图谱上观察到。这就可以进一步鉴定重组体是不是所要的目的克隆。
六、核苷酸序列测定
所得到的目的序列或基因的克隆,都要用其核酸序列测定来最后鉴定。已知序列的核酸克隆要经序列测定确证所获得的克隆准确无误;未知序列的核酸克隆要测定序列才能确知其结构、推测其功能,用进一步的研究。因此核酸序列测定是分子克隆中必不可少的鉴定步骤。核酸序列测定的原理和方法在实验教材中有详细的叙述。
克隆基因的表达
使克隆的基因在细胞中表达对理论的研究和实验的应用都是十分重要的意义的。克隆的基因只有通过表达才能探索和研究基因的功能以及基因表达调控的机理,克隆基因表达出所编码的蛋白质可供作结构与功能的研究。有些具有特定生物活性的蛋白质在医学上、以至在工业上都是很有应用价值的,可以克隆其基因使之在宿主细胞中大量表达而获得。要使克隆基因在宿主细胞中表达,就要将它放入带有基因表达所需要的各种元件的载体中,这种载体就称为表达载体(expression vector)。克隆基因可以放在不同的宿主细胞中表达,可用大肠杆菌、枯草杆菌、酵母、昆虫细胞、培养的哺乳类动物细胞、以至整体动物。对不同的表达系统,需要构建不同的表达载体。克隆基因在不同的系统中表达成功的把握性,取决于我们对这些系统中基因表达调控规律的认识程度。
图1 几种常用的大肠杆菌表达载体
人类对大肠杆菌经过长期的研究,对其特性和遗传背景了解得最清楚,大肠杆菌培养操作简单、生长繁殖快、价格低廉,人们用大肠杆菌用外源基因的表达工具已有二十多年的经验积累,大肠杆菌表达外源基因产物的水平远高于其它基因表达系统,表达的目的蛋白量甚至能超过细菌总蛋白量的80%。因此大肠杆菌是目前应用最广泛的蛋白质表达系统。设计外源基因在大肠杆菌表达就需要外源基因在大肠杆菌中表达所需要的元件,包括转录起始必需的启动子、翻译起始所必需的核糖体识别序列等;外源基因表达的产物可能会对大肠杆菌有毒害作用,会影响细菌的生存繁殖,所以大多数表达载体都带有诱导性表达所需要的元件,即有操纵子序列以及与之配套的调控基因等;外源基因还应当插入到适合于表达的位置,所以表达载体中要设有适合的多克隆位点;此外还应具备基因克隆筛选的条件,包括在细胞中复制必需的复制起始序列、筛选标志如抗药性基因等。图2中绘出几种常用的表达载体例子。pBV220是我国科学工用者自己构建的表达载体,使用了很强的PRPL双启动子,含有编码温度敏感性阻遏蛋白的cI857基因,在30-32℃时产生的阻遏蛋白能阻止PRPL的转录起始,细菌可以正常生长繁殖,42摄氏度时该阻遏蛋白发生构像变化而失活,基因开始转录而表达。
图2 真核表达载体pSV2-neo
当要将真核基因放入原核细胞中表达产生蛋白质时,原核系统就表现出许多缺陷:①没有真核转录后加工的功能,不能进行mRNA的剪接,所以只能表达cDNA而不能表达真核的基因组基因;②没有真核翻译后加工的功能,表达产生的蛋白质,不能进行糖基化、磷酸化等修饰,难以形成正确的二硫键配对和空间构像折叠,因而产生的蛋白质常没有足够的生物学活性;③表达的蛋白质经常是不溶的,会在细菌内聚集成包涵体(inclusiion body),尤其当表达目的蛋白量超过细菌体总蛋白量10%时,就很容易形成包涵体。生成包涵体的原因可能有是蛋白质合成快速太快,多肽链相互缠绕,缺乏使多肽链正确折叠的因素,导致疏水基因外露等。细菌裂解后,包涵体的离心后的沉淀中,虽然有利于目的蛋白的初步纯化,但无生物活性的不溶性蛋白,要经过复性(renaturation),使其重新散开、重新折叠成具有天然蛋白构象和良好生物活性的蛋白质,常常是一件很困难的事情。也可以设计载体使大肠杆菌分泌表达出可溶性目的蛋白,但表达量往往不高。
?要表达真核生物的蛋白质,采用真核表达系统自然应比原核系统优越,常用的酵母、昆虫、动物和哺乳类细胞等表达系统。真核表达载体至少要含两类序列:①原核质粒的序列,包括在大肠杆菌中起作用的复制起始序列、能用在细菌中筛选克隆的抗药性基因标志等,以便插入真核基因后能先在很方便操作的大肠杆菌系统中筛选获得目的重组DNA克隆、并复制繁殖得到足够使用的数量。②在真核宿主细胞中表达重组基因所需要的元件,包括启动子、增强子、转录终止和加poly-A信号序列、mRNA剪接信号序列、能在宿主细胞中复制或增殖的序列,能用在宿主细胞中筛选的标志基因、以及供外源基因插入的单一限制性内切酶识别位点等。图2举出一个真核表达载体的例子。
DNA重组及基因工程技术对医学和生命科学发展的贡献
作为分子生物学发展的重要组成部分,DNA重组及基因工程技术给生命科学带来了革命性变化,促进着生命科学各学科研究和应用的进步,对推动医学各领域的发展同样起着重要的作用。
一、对人类遗传信息的认识
遗传信息决定生物的形态和特征,是生物生存之本。估计人类的基因组DNA约有4×109bp,含有约5-10万个基因,但至今人类对自己赖以生存繁衍的这个庞大的遗传信息库还知之甚少,目前已经知道的人基因只占估计数的百分之几,已搞清楚其表达调控者更寥寥无几,对占基因组80-90%不为蛋白质编码序列的认识更少,因而实际上我们现在对自己生存的基础和实质只有很表面的肤浅认识,设想如果人类掌握了自身全部遗传信息的结构、功能、表达和调控,无疑将能够深刻认识人的生长、发育、生存、繁衍的整个生老病死历程,将能对疾病的诊断、治疗和预防提出极有效的措施,将能真正掌握自己生存和发展的命运。
DNA重组技术的出现和发展,就使人们有可能去深入探索这个重大的课题。1985年提出的人基因组研究计划(Human Genome Project)很快得到世界科学的响应,这个研究计划的目标是要阐明人类遗传信息的组成和表达,是迄今全球性生物学、医学领域最引人注目的巨大研究工程。DNA重组是完成这个任务的主要手段,其中包括大片段DNA克隆、DNA的大尺度分析、全自动DNA序列测定,基因组信息数据库的建立等新思维和新技术的不断出现和发展,再加上大规模引入其它领域先进的科学技术,原预定21世纪头10年绘制出完整的人类染色体基因定位图、测定出人类基因组全部DNA序列,有望按期或提前完成。当然在这基础上要搞清楚全部人类基因的功能、各基因间的关系,基因表达调控、人类遗传信息的多样性等还要经历更长期和更艰苦的努力。但DNA重组技术促进了分子生物学迅速发展,给人类探索自身生命的奥秘展示了光明的前景。
生命关键的基础在于蛋白质与蛋白质、蛋白质与核酸相的相互作用,生物大分子的结构与功能的联系正是生命“活”的本质所在。凭借基因工程人们可以克隆获得天然的或任意设计的核酸序列,可以大量获得过去难以得到的生物体内极微量的活性蛋白质、可以设计获得任意定点突变(site-directed mutagenesis)的基因和蛋白质,这就为研究蛋白质与核酸的结构与功能、揭露生命的本质提供了很有力的手段。
二、基因工程药物与疫苗
利用基因工程技术生产有应用价值的药物是当今医药发展一个重要的方向,现在世界上已有几千家生物技术公司,其中多数都生产医药或医药研究所需的试剂。利用基因工程技术生产药物有两个不同的途径:一是利用基因工程技术改造传统的制药工业,例如用DNA重组技术改造制药所需要的菌种或创建的菌种,提高抗菌素、维生素、氨基酸产量等;二是用克隆的基因表达生产有用的肽类和蛋白质药物或疫苗,虽然基因诊断和医药研究试剂的基因工程产品已经很多,但目前基因工程药物还只处在发展的早期,至今真正被卫生部门正式批准投放市场的基因工程肽或蛋白类治疗药物现在还不多,但正在开发的基因工程治疗药物却有几百种,且而逐年迅速增加,可见其具有的巨大潜力。基因工程药物不仅用于医药上,还能用于工农业上,促进生产的发展,已经投放市场或近期可望投放市场的基因中程药物可举出以下例子。
1、基因工程疫菌? 乙型肝炎是常见的传染病,过去从病人血液中分离乙肝病毒的表面抗原作为疫苗,来源有限,价格昂贵,有潜在交叉感染的危险。现在克隆得病毒编码的HbsAg基因,使其表达获得大量HbsAg用作疫苗。1986年美国正式批准基因工程乙肝疫苗投放市场,我国的科学工作者也克隆得在我国流行常见乙肝病毒亚型的HbsAg基因,研制得适用于我国乙肝基因工程疫苗,并已生产和使用。近期可能投放市场的还有甲型肝炎、巨细胞病毒 、流行性出血热、轮状病毒、细菌性腹泻等基因工程疫苗。我军事医学科学院研制的仔畜腹泻基因工程疫苗,使仔畜免遭大肠杆菌腹泻之害,保护率达90%以上,为我国的肉食供应做出了贡献。
2、基因工程肽类药物? 由免疫细胞和其它细胞分泌的细胞因子是具有很高活动性的肽类分子,在调节细胞生长分化、调节免疫功能、参与炎症反应和创伤修复中起重要作用,其中许多很有应用价值,但其生成量极微,难以提取获得,基因工程则可克隆其基因,使之表达获得大量产物供用。传统的肽类激素,血液中的微量活性成分、酶类同样可用基因工程手段获得。表1列出一些已上市的正在研制的基因工程多肽药物。
表1 基因工程肽类药物
名称
作用
各种干扰素(interferon IFN)
抗病毒、抗肿瘤、免疫调节
各种细胞介素(interleukins ,IL)
免疫调节、促进造血
各种集落刺激因子(colony stimulating factors ,CSF)
刺激造血
红细胞生成素(erythropopoetin EPO)
促进红细胞生成,治疗贫血
肿瘤坏死因子(tumor necrosis factor,TNF)
杀伤肿瘤细胞、免疫调节、参与炎症和全身性反应
表皮生长因子(epidermal growth factor, EGF)
促进细胞分裂、创伤愈合、胃肠道溃疡防治
神经生长因子(nerve growth factor ,NGF)
促进神经纤维再生
骨形态形成蛋白(bone morphogenetic protein ,BMP)
骨缺损修复、促进骨折愈合
组织纤溶酶激活剂(tissue-type plasminogen activator ,t-PA)
溶解血栓、治疗血栓疾病
血凝因子Ⅷ、Ⅸ
治疗血友病
生长激素(rgowth hormone ,GH)
治疗侏儒症
胰岛素(insulin)
治疗糖尿病
超氧化物歧化酶(superoxide dismutase ,SOD)
清除自由基、抗组织损伤、抗衰老
3、基因工程抗体? 用传统细胞融合杂交瘤技术制备的单克隆抗多数是鼠源性抗体,用于人体会产生免疫排斥反应,用杂交瘤方法制备人源性抗体又遇到难以克服的困难。用基因工程的方法可以不经过杂交瘤技术而直接获得特定的人的抗体基因克隆。也可以计算机辅助设计,用DNA重组技术将鼠源性抗体基因人源化,然后放入表达载体,表达产生人源化抗体。我国已成功克隆得到多种肿瘤、抗病毒、抗细胞因子、抗细胞受体等不同单克隆的基因,鼠源性抗人肝癌、抗人黑色素瘤、抗人纤维蛋白抗体基因的人源化工作正在进行,并已成功直接获得人源性抗乙型肝炎病毒抗体基因。不同类型的抗体基因已分别在细菌、昆虫细胞、培养的哺乳细胞和植物中表达。基因工程抗体被称为第三代抗体,其研制虽然刚起步,但已展示出良好的应用前景。
三、转基因动物和植物
克隆的基因不仅导入细菌和培养的细胞,而且能转入动植物体内、改变其遗传特性。转基因动物(transgenic animals)就是指在其基因组内稳定地整合有外源基因、并能遗传给后代的动物。1979年Mintz等将SV40病毒NDA导入小鼠早期胚胎的囊胚腔,第一次得到载有人工导入外源基因的嵌合体小鼠(chimeic morse)。1982年Palmiter等将克隆的生长激素基因用显微注射(microinjection) 的方法直接导入小鼠受精卵细胞核内,所得转基因的小鼠的肝、肌、心等组织都能产生生长激素,小鼠比原个体大几倍,称为“巨鼠”,使人们意识到转基因技术的巨大潜力及其在遗传育种方面的划时代意义,除受精卵外,从胚胎中分离的多潜能干细胞(ES细胞 ,embryonic stem cells)也能接受外源基因发育成个体,外源基因的导入还可以采取逆转录病毒载体感染等方法。目前已经得到的转基因动物除鼠外还有转基因兔、羊、猪等。
利用转基因动物可以建立人类疾病的动物模型,为对人类疾病病因研究,以及测试新治疗方法提供了有力手段。例如用导入各种癌基因、致瘤病毒基因或其调控序列等的转基因小鼠,可以观察肿瘤发生的历程和影响因素;导入相关突变基因的转基因动物可以造出糖尿病、镰刀形细胞贫血、白内障等疾病模型;用肝炎病毒基因的转基因动物可以研究肝炎病毒基因在肝炎病中的作用,利用导入各种细胞因子基因、免疫功能基因、以及特定核酸序列的转基因动物可以从整体研究细胞因子、免疫调控、基因表达调控等问题。
近年来转基因动物技术又有新的发展。ES细胞导入与目的基因同源的序列,则在体内可以经同源重组使用的基因发生突变,这样成长起来的动物有目的基因的缺陷,这种技术称为基因打靶(gene targetting)。用基因打靶可以在整体水平上研究基因的功能,并能制造出遗传缺陷的疾病模型。
用转基因动物还能获得治疗人类疾病的重要的蛋白质。例如导入了凝血因子Ⅸ基因的转基因绵羊分泌的乳汁中含有丰富的凝血因子Ⅸ,能在效地用于血友病的治疗。
转基因技术在遗传育种上闯出了新路。成功获得“巨鼠”,激起了人们的创造优良品持家畜的热情。我国水生生物研究所将生长激素基因转入鱼受精卵,得到的转基因鱼生长显著加快、个体增大;转基因猪也正在研制中。
转基因植物在育种上也获得成绩。1994年比普遍西红柿保鲜时间更长的转基因西红柿投放市场,1996年转基因玉米、转基因大豆相继投入商品生产。美国最早研制得抗虫棉花,我国科学家将自己发展的蛋白酶抑制剂基因转入棉花获得抗棉铃虫的棉桦株。到1996年全世界已有250万公顷土地种植转基因植物。与按传统孟德尔遗传规律育种比较,转基因技术显出其优越和更大的潜力,提高光合作用、扩大固氮能力、提高营养价值、抗虫、抗病、抗旱等转基因植物都在研究中。将人的基因转入植物还可能获得医学上的治疗用途的药物,例如将人抗体基因转入烟草,从烟叶中就能提取得人的抗体蛋白。
四、基因诊断与基因治疗
基因克隆和基因分析的手段得到与人类疾病有关的基因异常变化、以及致病微生物基因结构方面的知识,就可能用检测和分析基因的方法去诊断疾病。对与疾病相关的基因及其调控了解,就有可能导入外源目的基因去纠正基因缺陷或改变基因表达调控以期达到治疗疾病的目的。这些都是分子生物学进展在医学上重要的应用。因而本书列出两章专门讨论,在此不再重复叙述。
NDA重组技术和基因工程使人类进入了能动改造的生物界的新纪元,使医学发展到分子医学的新阶段。但由于人类对生物基因组的结构、基因表达调控等认识还很有限,因而分子生物学的成果在医学上的应用还处在初级阶段。新的基因工程药物虽然不断涌现,但已应用的还是少数,而且由于对基因产物的整体效应等研究还不够充分,即使已批准投入市场的基因工程药物,有的疗效还不很理想。基因诊断应用的范围尚有待扩大,基因治疗理想成功的例子还不多。转基因的工作还由于基因导入后在基因组上的定位整合等知识和技术尚不成熟,因而现在转基因的工作还很盲目、成功率还很低。这些都有待于进行许多扎实的基础研究,了解更多分子遗传学方面规律,并改进和创建新的技术,才能得到提高。然而探索着生命本质的分子生物学已经指出了光明的前程,随着科学的进步,肯定将逐步实现能按人们的意志去获得理想的结果,可以说“前途光明灿烂,道路曲折而遥远”。
小结
基因工程又称遗传工程,是生物工程的主导技术。DNA重组技术或分子克隆是基因工程的核心。分子生物学研究中发现的许多核酸酶类都可用作基因工程的工具。其中能识别特定的回文序列并切割DNA双链的Ⅱ类限制性核酸内切酶在DNA重组技术中被广泛应用。
当前目的基因序列主要来源于自然界的生物,无性繁殖的纯基因称为基因克隆,目的基因或核酸序列必须由载体携带进入宿主细胞复制繁殖才能分离到克隆。常用的载体有质粒、噬菌体、病毒、酵母人工染色体等,载体必须能携带目的序列有效地进入宿主细胞复制繁殖,并应当具有良好的标志可供识别和筛选,常用有抗药性和α互补蓝白筛选标志等。为获得目的基因克隆,可构建生物的基因组文库,完整的基因组文库是含有该生物全部遗传信息的克隆集合体,从基因组文库中可以克隆得该生物的基因组基因;以mRNA为模板经反转录酶催化合成与 NRA序列互补的DNA称为cDNA,可以从组织细胞提取mRNA构建cDNA文库,完整的cDNA文库可以获得特定基因的cDNA构隆。目的基因也可以用PCR或人工合成核酸的方法得到,但还离不开从生物基因组和cDNA获得基因序列知识。要设计严密的方案,借助工具酶的作用,将目的基因或序列以适当的连接方式插放载体,用转化、感染或转染的方法导入宿主细胞繁殖,经抗药生长、呈色显示,核酸分子杂交、PCR、免疫学亲和结合或限制性酶谱分析等方法筛选获得克隆,最后要经过核酸序列分析鉴定。
克隆的基因可以插入表达载体中带有宿主细胞中表达,这是研究目的基因功能和获取基因产物必需步骤。表达载体应当具备在宿主细胞中复制繁殖、筛选、目的基因插入、以及基因表达所需要的各种元件。大肠杆菌遗传背景清楚、操作容易、经济、表达水平高,是最常用的表达系统,但它不适用于真核基因组基因的表达并缺乏真核转录后加工、翻译后加工等功能。
DNA重组技术和基因工程是分子生物学发展的突出领域,开创了人类能动改造生物界的新阶段,推动了医学和整个生命科学的进步,为基因诊断、基因治疗 、基因工程药物的发展开辟了道路,是分子生物学走向广泛应用的重要方面,目前基因工程还只是发展的初阶段,它将依赖于分子生物学的进步而发展。
细胞通讯方式
细胞通讯与细胞信号转导的分子机理
Cell Communication and Cell Signal Transduction
高等生物所处的环境无时无刻不在变化,机体功能上的协调统一要求有一个完善的细胞间相互识别、相互反应和相互作用的机制,这一机制可以称作细胞通讯(Cell Communication)。在这一系统中,细胞或者识别与之相接触的细胞,或者识别周围环境中存在的各种信号(来自于周围或远距离的细胞),并将其转变为细胞内各种分子功能上的变化,从而改变细胞内的某些代谢过程,影响细胞的生长速度,甚至诱导细胞的死亡。这种针对外源性信号所发生的各种分子活性的变化,以及将这种变化依次传递至效应分子,以改变细胞功能的过程称为信号转导(Signal Transduction),其最终目的是使机体在整体上对外界环境的变化发生最为适宜的反应。在物质代谢调节一章中曾涉及到神经-内分泌系统对代谢途径在整体水平上的调节,其实质就是机体内一部分细胞发出信号,另一部分细胞接收信号并将其转变为细胞功能上的变化的过程。所以,阐明细胞信号转导的机理就意味着认清细胞在整个生命过程中的增殖、分化、代谢及死亡等诸方面的表现和调控方式,进而理解机体生长、发育和代谢的调控机理。近年来,随着分子生物学技术手段的改进,人们对细胞内信号转导机理的认识也日益深入。现已知道,细胞内存在着多种信号转导方式和途径,各种方式和途径间又有多个层次的交叉调控,是一个十分复杂的网络系统。科学家们相信,将来他们会绘制出一个类似于代谢网络图的细胞信号传递的网络图,不过这个网络图可能较代谢图更为复杂。
细胞通讯方式
单细胞生物仅与环境交换信息,高等生物则根据自然需求进化出一套精细的调控通讯系统,以保持所有细胞行为的协调统一。细胞间主要以如下三种方式进行联络(图1)。
图1 三种细胞通讯的基本方式
(一)细胞间隙连接
细胞间隙连接(Gap Junction)是一种细胞间的直接通讯方式。两个相邻的细胞间存在着一种特殊的由蛋白质构成的结构-连接子(Connexon),其结构见图2和图3。连接子两端分别嵌入两个相邻的细胞,形成一个亲水性孔道。这种孔道允许两个细胞间自由交换分子量为1500道尔顿以下的水溶性分子。这种直接交换的意义在于,相邻的细胞可以共享小分子物质,因此可以快速和可逆地促进相邻细胞对外界信号的协同反应。
连接子为一个多基因家庭,现已发现12个成员。在肿瘤生长和创伤愈合等过程中都观察到某些类型连接子表达的变化。因此,连接子可能对细胞的生长、分化、定位及细胞形态的维持具有重要意义。
(二)膜表面分子接触通讯
每个细胞都有众多的分子分布于膜的外表面。这些分子或为蛋白质,或为糖蛋白。这些表面分子作为细胞的触角,可以与相邻细胞的膜表面分子特异性地相互识别和相互作用,以达到功能上的相互协调。这种细胞通讯方式称为膜表面分子接触通讯(Contact signaling by plasmamembranebound molecules)。膜表面分子接触通讯也属于细胞间的直接通讯,最为典型的例子是T淋巴细胞与B淋巴细胞的相互作用(图4)。
图2 间隙连接功能示意图,荧光标记的不同大小的分子注入细胞后,依靠间隙连接进入另外一个细胞,图中数字表示分子量。
图3 间隙连接结构示意图
图4 膜表面分子接触通讯举例
图5 化学信号的三种形式
(三)化学通讯
细胞可以分泌一些化学物质-蛋白质或小分子有机化合物至细胞外,这些化学物质作为化学信号(chemical signaling)作用于其它的细胞(靶细胞),调节其功能,这种通讯方式称为化学通讯。化学通讯是间接的细胞通讯,即细胞间的相互联系不再需要它们之间的直接接触,而是以化学信号为介质来介导的。根据化学信号分子可以作用的距离范围,将其分为三类(图5)。
1.内分泌(endocrine)系统以激素为主,它们是由内分泌器官分泌的化学信号,并随血流作用于全身靶器官。
图6 水溶性和脂溶性化学信号的转导
2.旁分泌(paracrine)系统以细胞因子为主,它们主要作用于局部的细胞,作用距离以毫米计算。
3.自分泌(autocrine)系统神经介质为主,其作用局限于突触内,作用距离在100nm以内。
化学信号还可以根据其溶解性分为脂溶性化学信号和水溶性化学信号两大类。所有的化学号都必须通过与受体结合方可发挥作用,水溶性化学信号不能进入细胞,其受体位于细胞外表面。脂溶性化学信号可以通过膜脂双层结构进入胞内,其受体位于胞浆或胞核内(图6)。下面分别介绍这两种受体转导生物信号的特点。
细胞内受体的信号转导机理
脂溶性化学信号(如类固醇激素、甲状腺素、前列腺素、维生素A及其衍生物和维生素D及其衍生物等)的受体位于细胞浆或细胞核内。激素进入细胞后,有些可与其胞核内的受体相结合形成激素-受体复合物,有些则先与其在胞浆内的受体结合,然后以激素-受体复合物的形式进入核内。
图1 类固醇激素及其受体的作用机理示意图
这些受体均属于转录因子,并具有锌指结构作为其DNA结合区(见第十九章)。在没有激素作用时,受体与热休克蛋白(Heat shock proteins, Hsps,见第一章)形成复合物,因此阻止了受体向细胞核的移动及其与DNA的结合。当激素与受体结合后,受体构象发生变化,导致热休克蛋白与其解聚,暴露出受体核内转移部位及DNA结合部位,从而激素受体复合物向内转移,并结合于DNA上特异基因邻近的激素反应元件(hormone response element, HRE)上(图1)。
不同的激素-受体复合物结合于不同的激素反应元件(表21-1)。结合于激素反应元件的激素-受体复合物再与位于启动子区域的基本录因子及其它的转录调节分子作用,从而开放或关闭其下游基因(见图2)。
图2 水溶性和脂溶性化学信号的转导
表21-1 激素反应元件·(HRE)
激素
DNA序列(双股)
糖皮质激素
5′AGAACA×××TGTTCT3′
3′TCTTGT×××ACAAGA5′
雌激素
5′AGGTCA×××TGACCT3′
3′TCCAGT×××ACTGGA5′
甲状腺素
5′AGGTCATGACCT3′
3′TCCAGTACTGGA5′
* X代表任一核苷酸
膜受体介导的信号转导
与脂溶性的化学信号不同,亲水性信号分子(所有的肽类激素、神经递质和各种细胞因子等)均不能进入细胞。它们的受体位于细胞表面。这些受体与信号分子结合后,可以诱导细胞内发生一系列生物化学变化,从而使细胞的功能如生长、分化及细胞内化学物质的分布等发生改变,以适应微环境的变化和机体整体需要。这一过程可以称之为跨膜信号转导。在这一信号转导过程中,信号分子不进入细胞。虽然有些信号分子与受体结合后可以发生内化(internalization),但这不是主要的作用方式。这种位于膜表面的受体所介导的信号传递主要表现为,各种参与信号传递的信号分子的构象、浓度或分布发生变化,各种信号分子之间发生相互识别和相互作用。
一、膜受体的分类
随着越来越多的膜表面受体被纯化,其结构及转导信号的方式逐步得以阐明。目前,按照受体的结构及其作用方式可将其分为三大类。这三大类受体在配体种类、受体的一般结构和功能及细胞对之发生反应的方式上有所不同,见表1。
Table 1 Classification of Membrane Receptors: Characteristics of Three Groups of Receptors
Characteristics
Ion Channel
Receptors
G-Protein-Linked
receptors
Recetpors with a Single
Transmembrane Domain
Endogenous ligands
Neurotransmitter
Neurotransmitter
Growth factor hormone
?
?
Hormone
Cytokine
?
?
Auloacoid
?
?
?
Chemotactic factor
?
?
?
Exogenous stimulant
?
Structure
Oligomer with a pore
Probably monomer
Monomer of oligoner
?
?
?
with (±)catalytic
?
?
?
domain
Number of transmem
Four per subunit
Seven
One per subunit
bane segments
?
?
?
Function
Ion channel
Activation of G proteins
Tyrosine kinase
?
?
?
Giuanylate cyclase(?)
Cellular responses
Depolarization or
Depolarization or
Regulation of function
??
hyperpolarization
hyperpolarization
and expression of
?
?
Regulation of function
proteins
?
?
and expression of
Proliferation or
?
?
proteins
differentiation
二、膜受体信号转导的分子机理
(一)离子通道型受体及其信号转导
离子通道型受体是一类自身为离子通道的受体。这种离子通道与受电位控制的离子通道及受化学修饰调控的离子通道不同,它们的开放或关闭直接受配体的控制,其配体主要为神经递质。
图1 乙酰胆碱受体的结构模式图
图21-8显示了作为离子通道受体的典型代表-乙酰胆碱受体的结构模式。乙酰胆碱受体是由5个同源性很高的亚基构成,包括2个α亚基,1个β亚基,1个γ亚基的和1个δ亚基。每一个亚基都是一个四次跨膜蛋白,分子量约60kd,约由500个氨基酸残基构成。推测跨膜部分为四条α螺旋结构,其中一条α螺旋含较多的极性氨基酸,就是由于这个亲水区的存在,使五个亚基共同在膜中形成一个亲水性的通道。乙酰胆碱的结合部位位于α亚基上。
乙酰胆碱受体可以以三种构象存在(图2)。两分子乙酰胆碱的结合可以使之处于通道开放构象,但即使有乙酰胆碱的结合,该受体处于通道开放构象状态的时限仍十分短暂,在几十毫微秒内又回到关闭状态。然后乙酰胆碱与之解离,受体则恢复到初始状态,做好重新接受配体的准备。
图2 乙酰胆碱受体的三种构象示意图
离子通道受体信号转导的最终作用是导致了细胞膜电位的改变,可以认为,离子通道受体是通过将化学信号转变成为电信号而影响细胞的功能的。
离子通道型受体可以是阳离子通道,如乙酰胆碱、谷氨酸和五羟色胺的受体,也可以是阴离子通道,如甘氨酸和γ-氨基丁酸的受体。
(二)G蛋白偶联型受体及其信号转导
G蛋白偶联型受体包括多种神经递质、肽类激素和趋化因子的受体,在味觉、视觉和嗅觉中接受外源理化因素的受体亦属G蛋白偶联型受体。这类受体在结构上均为单体蛋白,氨基末端位于细胞外表面,羧基末端在胞膜内侧。完整的肽链要反复跨膜七次(图3),因此亦有人将此类受体称为七次跨膜受体。由于肽链反复跨膜,在膜外侧和膜内侧形成了几个环状结构,它们分别负责与配体(化学、物理信号)的结合和细胞内的信号传递。其胞浆部分可以与一种GTP结合蛋白(简称G蛋白)相互作用,这种G蛋白是该信号传递途径中的第一个信号传递分子,这也是这类受体被称为G蛋白偶联型受体的原因。
图3 七次跨膜受体-G蛋白偶联
型受体跨膜结构示意图
G蛋白偶联受体的信号传递过程包括(1)配体与受体结合,(2)受体活化G蛋白;(3)G蛋白激活或抑制细胞中的效应分子;(4)效应分子改变细胞内信使的含量与分布,(5)细胞内信使作用于相应的靶分子,从而改变细胞的代谢过程及基因表达等功能。本节将逐一介绍这一过程的主要环节。
1.G蛋白的循环或活化(G Protein Cycle)
G蛋白偶联型受体的信号转导途径中的第一个信号传递分子是G蛋白,其活化过程称为G蛋白循环。
G蛋白以α、βγ亚基三聚体的形式存在于细胞质膜内侧。α亚基已发现有20余种,分子量为36~52kd。α亚基具有多个活化位点,其中包括可与受体结合并受其活化调节的部位、与βγ亚基相结合的部位、GDP或GTP结合部位以及与下游效应分子相互作用的部位等等。α亚基还具有GTP酶活性。α亚基结合GDP时是无活性状态,而与GTP结合时则为有活性状态,GTP的水解又使其返回无活性状态。
G蛋白中的β和γ亚基亦有数种,但不及α亚基种类多。在细胞内,β和γ亚基形成紧密结合的二聚体,只有在蛋白变性条件下方可解离,因此可以认为它们是功能上的单体。βγ亚基的主要作用是与α亚基形成复合体并定位于质膜内侧。近年来的研究表明,βγ亚基亦可作用于其下游效应分子。
图4 G蛋白循环示意图
G蛋白循环的具体过程可见图4。当物理或化学信号刺激受体时,受体活化G蛋白使之发生构象改变。α亚基与GDP的亲和力下降,结合的GDP为GTP所取代。α亚基结合了GTP后即与βγ亚基发生解离,成为活化状态的α亚基。活化了的α亚基此时可以作用于下游的各种效应分子。这种活化状态将一直持续到GTP被α亚基自身具有的GTP酶水解为GDP。一旦发生GTP的水解,α亚基又再次与βγ亚基形成复合体,回到静止状态,重新接受新的化学信号。
由于G蛋白的种类不同,因此G蛋白可以作用于不同的效应分子,或对同一效应分子进行不同的调节。
2.效应分子及细胞内信使
G蛋白活化之后,可作用于腺苷酸环化酶和磷脂酶C等效应分子(Effector)上。有的α亚基(Gs)可以激活腺苷酸环化酶;有的α亚基(αi)可以抑制腺苷酸环化酶。腺苷酸环化酶催化ATP生成环状AMP(cAMP)的反应,因此细胞内的cAMP水平在配体与受体结合后,可受G蛋白α亚单位的作用而升高或降低,从而将细胞外信号转变为细胞内信号。这种细胞内信号可再作用于下游分子。这种细胞内信号的传递方式是G蛋白偶联型受体传递信号的主要方式,这些细胞内信号分子被称为细胞内信使。细胞内信使亦被称为第二信使。已知的细胞内信使包括cAMP、cGMP、甘油二酯(DAG)、IP3、和Ca2+等等(图5、6、7)。G蛋白的α亚基种类、其作用的效应分子及所调节的细胞内信使可参见表21-3。
图5 cAMP的生成与水解
图6 cGMP的生成
图7 DAG和IP3的生成
细胞内信使一般具有以下三个特点:(1)多为小分子,且不位于能量代谢途径的中心;(2)在细胞中的浓度或分布可以迅速地改变;(3)作为变构效应剂可作用于相应的靶分子,已知的靶分子主要为各种蛋白激酶。
表2 G蛋白的α亚基及其效应分子
Ca种类
效应分子
细胞内信使
靶分子
as
腺苷酸环化酶活性急↑
cAMP↑
蛋白激酶A活性↑
ai
腺苷酸环化酶活性↓
cAMP↓
蛋白激酶A活性↓
aq
磷脂酶C活性↑
Ca2+IP↑3DAG
蛋白激酶C活化↑
at
cGMP磷脂二酯酶↑活性
cGMP↓
Na+通道关闭
cAMP是第一个被发现的细胞内信使,催化它生成的腺苷酸环化酶为一重要的Gαi和Gαs的效应分子。cAMP是很多激素的细胞内信使。另一类重要的细胞内信使是在磷脂酰肌醇特异性磷脂酶C作用下,由PIP2(二磷酸磷脂酰肌醇)水解生成的三磷酸肌醇(IP3)和甘油二酯(DAG)。
需要指出的是,除G蛋白偶联型受体在其信号转导过程中需细胞内信使作为信号的传递者外,细胞内还存在受其它的信号转导方式调控的细胞内信使。九十年代以来,越来越多的以小分子物质作为细胞内信使参与细胞功能调控的过程得以阐明。
G蛋白偶联型受体在G蛋白介导下的信号传递过程可见图8和图9。
图8 G蛋白偶联型受体-G蛋白-腺苷酸环化酶信号转导途径示意图
图9 G蛋白偶联型受体-G蛋白-磷脂酶C信号转导途径示意图
3.细胞内信使作用的主要靶分子
活化的Gα可作用于相应的效应分子,从而使相应的细胞内信使浓度发生迅速的改变。这些细胞内的信使可分别作用于相应的靶分子,从而使得细胞中的各种酶类和蛋白分子的活性发生改变。这些细胞内信使所作用的靶分子主要为各种蛋白激酶(表21-3)
(1)蛋白激酶A
cAMP作用于cAMP依赖性蛋白激酶(cAMP-dependent Protein Kinase,简称为cAPK),亦称为蛋白激酶A(Protein Kinase A, PKA),目前后一种命名较为公认。cAMP可以作为该激酶的变构激活剂,使无活性的蛋白激酶A转变为有活性的蛋白激酶A(详见第十一章,图11-4)。活化了的蛋白激酶A可作用于多种与糖脂代谢相关的酶类、一些离子通道和某些转导因子,使它们发生磷酸化并改变其活性状态。
(2)蛋白激酶G
细胞内的另一种环核苷酸信使为环鸟苷酸-cGMP。cGMP作用于cGMP依赖性蛋白激酶-cGMPdependent Protein Kinase, cGPK),亦称为蛋白激酶G(Protein Kinase G、PKG)。与PKA一样,PKG是目前较为公认的命名。蛋白激酶G以cGMP作为变构效应剂,在脑和平滑肌中含量较丰富。1997年,人们发现,PKG的基因突变与果蝇的觅食行为有关。我们可以推测,PKG很有可能在神经系统的信号传递过程中具有重要作用。
(3)蛋白激酶C
另外一些重要的细胞内信使还包括磷脂酰肌醇的衍生物如DAG、PIP3(三磷酸磷脂酰肌醇)、磷脂酰胆碱的衍生物、鞘磷脂的衍生物以及Ca2+等等。这些小分子信使的一个重要靶分子是蛋白激酶C(Protein Kinase C、PKC)。
PKC有多种同工酶形式,均以希腊字母排列,有PKCα、PKCβI、PKCβⅡ和PKCγ等等。不同的同功酶在结构和组织分布上各有不同,其对辅助因子(包括上述细胞内小分子信使)的需求亦有差别,并且对底物有选择性。
PKC在细胞的生长分化的调控中及其它多种细胞功能上具有关键性的调节作用,是一类非常重要的信号转导分子。细胞信号转导过程中的多条途径都可以导致PKC的活化。已经有很多实验研究证明,PKC的抑制剂可以使细胞失去对生长分化刺激信号的反应,表明这些功能都依赖于PKC的调控。例如,肥大细胞的脱颗粒反应(释放出大量组织胺等血管活性物质)是机体变态反应的重要形式之一。体外实验表明,如果用PKC抑制剂预先处理细胞,细胞就不会对刺激信号再发生脱颗粒反应。如果用改变细胞膜通透性的方式使胞内的PKC漏出,细胞也会失去发生脱颗粒反应的能力,此时若再加入PKC使之回到细胞中,则又可恢复细胞的脱颗粒反应。其它很多类似的实验亦表明,细胞的很多其它功能也受到PKC的调控。
(三)单次跨膜受体及其信号转导
多种生长因子和细胞因子的受体为一类结构上为单次跨膜的糖蛋白。与七次跨膜受体(G蛋白偶联型受体)相对应,将其称为单次跨膜受体,即它们的跨膜区仅为单向一次性的,而不像七次跨膜受体那样有反复的跨膜区段。
单次跨膜受体依照其结构特点可进一步分成多个家族和亚家族,其分类见表3及图10。
图10 各类单次跨膜受体的代表性举例
Table3 Families of Receptors Activated by Dimerization or Oligomerization
Receptor Type
Family
Examples
Characteristics
Protein-tyosine kinase receptors
PDGF receptor
PDGFR-α,PDGFR-βSCFR
Five immunoglobulin-like
family
(Kit),CSF-R(Fms),Flk-2
domains extracellularly
EGF receptor family
EGFR(ErbB),ErbB2(Neu),ErbB3,ErbB4
Two cysteine-rich
IGF receptor family
insulin R,IGF-1R
domains extracllularly
HGF receptor family
HGFR(Met),MSPR(Ron)
Disulphide-bound heteroteramer of a and βchain
VEGF receptor family
Flt-1,Flk-1(KDR)
Seven immunolobulin-like domains extracellularly
Neurotrophin receptor family
Trk,TrkB,TrkC
Eph receptor family
Eph ,E1k,Eck,Cck5,Sek,Erk
Two FNIII-like domains and a cysteinerichdomain extracellularly
Cytokine receptors
Class 1 cytokine receptor family
?
?
CH receptor subfamily
GHR,EPOR,PRLR,G-CSFR
Form homodimers
IL-3 receptor subfamily
IL-3R,GM-CSFR,IL-5R
Form complexes with the cβ subunit
IL-6 receptor subfamily
IL-6R,LIFR,CNTFR,IL-11R
Form complexs with gp 130
IL-2receptor subfamily
IL-2R,IL-2Rβ,IL-4R,IL-7R
Form complexes with il-2Rγ
?
IFN-α/βR,IFN-γRα,IFN-γRβIL-10R
?
TNF receptor family
??
TNFR-1,TNFR-11MLNGFR,CD40,OX-40,Fas,CD27,CD30
Form trimers
Antigen receptors
?
TCR
Complex of α,β,γ,δ,ε,ζandηsubunits
?
BCR
Complex of IgM and heterodimers ofα/βsubunits
Serine/threonine kinase receptor family
Type Ⅱ receptor family
TGFβR-Ⅱ,ActR-Ⅱ,ActR-ⅡB
Form hetero-oligomers with type Ireceptors,i, e,TGFβ-I,ActR-1,ActR-1B,BMPR-1A,BMPR-1B,ALK-1
Receptor families and subfamilies discussed in the text are presented .Abbreviations used: R, receptor; R, receptor; PDGF, platelet-derived growth factor; SCF, stem cell factor; CSF, colony-stimulationg factor; EGF, epidermal growth factor; FGF, fibroblast growth factor; IGF, insulin-like growth factor; HGF, hepatocyte growth factor;MSP,macrophage-stimulating protein;VEGF,vascular endothelial growth factor;FN,fibronectin;GH,growth hormone;EPO,erythropoietin;PRL,prolactin;IL,interleukin;LIF,leukemia inhibitory factor;CNTR,ciliary neurotrophic factore;IFN,interferon;TNF,tumor necrosis factor;Lngfr,low affinity nerve growth factor rcecptor;TCR,T ,cell rcecptor;BCR,B cell rcecptor;receptor;TGFR,transfoming growth factor βAct,activin;BMP,bone morphogenic protein,Alternative desingations are given within parentheses.
单次跨膜受体所介导的信号传递与转换过程与G蛋白偶联型受体介导的信号转导有着很大差别。我们已经知道,G蛋白偶联型受体所介导的主要是经由G蛋白的激活,然后作用于相应的效应分子,接下来最主要的是导致细胞内信使含量及分布的迅速改变从而调节靶分子的活性并改变细胞的功能状态。单次跨膜受体介导的信号转导过程则主要是蛋白分子的相互作用,并且有蛋白酪氨酸激酶的广泛参与。对这些信号转导途径的了解在九十年代中取得了许多重要的进展。为跟踪和理解这些信号转导过程,我们首先需要知道参与这一过程的重要信号转导分子和其中的一些特殊结构。
1.几类重要的介导单次跨膜受体信号转导的蛋白分子的结构及功能
(1)蛋白激酶
蛋白激酶是指能够将γ-磷酸基因从磷酸供体分子上转移至底物蛋白的氨基酸受体上的一大类酶。磷酸供体可以是ATP,也可以是其它类三磷酸核苷酸。由于蛋白激酶常常是多底物的,因此蛋白激酶是根据底物中氨基酸残基的特异性而不是根据底物蛋白的特异性来分类的。国际生化学会命名委员会建议将蛋白激酶分为五大类:
激???? 酶
磷酸基团的受体
蛋白丝氨酸/苏氨酸激酶
丝氨酸/苏氨酸羟基
蛋白酪氨酸激酶
酪氨酸的酚羟基
蛋白组/赖/精氨酸激酶
咪唑环,胍基,ε-氨基
蛋白半胱氨酸激酶
巯基
蛋白天冬氨酸/谷氨酸激酶
酰基
前两类激酶目前了解的较多,很多已经获得了cDNA克隆,但对后两者的了解仍很有限。
蛋白丝/苏氨酸激酶和蛋白酪氨酸激酶的分类见表4。
表4 蛋白激酶分类
1.蛋白丝氨酸/苏氨酸激酶
? (1) Cyclic nucleotide regulated
A. PKA α cAMPdependent protein kinase catalytic, α form
B. PKA β cAMPdependent protein kinase catalytic, β form
C. PKA γ cAMPdependent protein kinase catalytic, γ form
D. cGPKα cGMPdependent protein kinase α form
E. cGPKβ cGMPdependent protein kinase β form
? (2) Diacylglycerol regulated:[BH]
PKC α protein kinase C α
? PKC β protein kinase C β
? PKC γ protein kinase C γ
? PKC δ protein kinase C δ
? PKC ε protein kinase C ε
? PKC ζ protein kinase C ζ
? PKC η protein kinase C η
? (3) Calcium/calmodulin regulated[BH]
? CaMⅠ Calcium/calmodulindependent protein kinase Ⅰ
? CaMⅡα Calcium/calmodulindependent protein kinase Ⅱα
? CaMⅡβ Calcium/calmodulindependent protein kinase Ⅱβ?
? CaMⅡγ Calcium/calmodulindependent protein kinase Ⅱγ
? CaMⅢCalcium/calmodulindependent protein kinase Ⅲ
? CaMⅣCalcium/calmodulindependent protein kinase Ⅳ
????????? ? PSKHI Putative proteinserine kinase
? (4) Ribosomal S6 protein kinase
????????? ? S6kⅠ,S6KⅡ,70kDaS6
? (5) Serpentine receptor kinase
????????? ? ① β ARK βAdrenergic receptor protein kinase
????????? ? ② β ARKrelated protein kinase
????????? ? ③ Rhodopsin kinase
? (6) Casein kinase Ⅱ
? (7) Glycogen synthase kinase 3
? (8) cdc 2 family
? (9) cdc 2 related protein kinase
? (10)MAP kinase (mitogen activated protein kinases)
????????? ? EPK-1, ERK-2, ERK-3, ERK-5(extracellular signal-regulated kinase)
????????? ? JNK(c-Jun N-terminal kinase), P38, etc.
? (11)MOS/Raf protein kinase
2.蛋白酪氨酸激酶
? (1) Growth factor receptors
????????? ? EGFR: EGFR.erbB2,erbB3
????????? ? INSR: INSR, IGF1R
????????? ? FGFR: FGFR, FGFR2, ckit
????????? ? DGFR: PDGFR, CSFIR
? (2) Nonreceptor tyrosine kinase
????????? ? Src family: Src,Yes,Lyn,Fyn,Lck,etc
????????? ? Syk family: Syk, ZAP70
????????? ? JAK family: JAK1,JAK2, JAK3
????????? ? Tec family: Btk,Itk,etc
表中列出的多种蛋白激酶都属于重要的信号转导分子,在此不可能一一介绍。在这些蛋白激酶中,对于细胞功能影响较大的有PKA、PKG、PKC、MAPK和PTK等。PKA、PKG和PKC已在G蛋白偶联受体中提及,因此这里仅介绍MAPK和PTK。
①MAP激酶(Mitogen Activated Protein Kinase, MAPK)
MAPK属于蛋白丝/苏氨酸激酶,是接受膜受体转换与传递的信号并将其带入细胞核内的一类重要分子,在多种受体信号传递途径中均具有关键性作用。在未受刺激的细胞内,MAPK为静止型,当其接收上游分子棗MAPKK(MAP Kinase Kinase)的磷酸化调控信号后,MAPK中相邻的苏氨酸和酪氨酸均被磷酸化,从而成为活化形式的MAPK(图11)。目前在MAPK的上游存在着一个
图11 MAPK的活化
图12 MAPK的逐级激活
由蛋白激酶构成的MAPK逐级激活系统。上述使MAPK磷酸化的MAPKK又受到MAPKKK(MAP Kinase Kinase Kinase)的调节。这种逐级激活系统又再受其上游分子的调控(图12)。
MAPK被激活以后,转移至细胞核内。在核内,它可以使一些转录因子发生磷酸化从而改变胞内基因表达的状态。另外,它也可以使一些其它的酶发生磷酸化使之活性发生改变。目前已经知道,MAPK参与多种细胞功能的调控,尤其是在细胞增殖、分化及凋亡过程中,它具有关键性作用。
MAPK途径在果蝇中已发现了7种不种类型,在哺乳动物细胞中已证实至少有三种MAPK成员,即ERK、JNK和P38。它们的调控机制和作用的靶分子均有所差异。
②蛋白酪氨酸激酶(Protein Tyrosine Kinase, PTK)
蛋白酪氨酸激酶作用于蛋白质中的酪氨酸残基使之磷酸化,很多细胞信号转导的最早期事即为多种蛋白质的酪氨酸磷酸化。在细胞的生长与分化过程中,酪氨酸磷酸化大部分具有正向调节作用,无论是生长因子作用后正常细胞的增殖、恶性肿瘤细胞的增殖,还是T细胞、B细胞或肥大细胞的活化都伴随着瞬间发生的多种蛋白分子的酪氨酸磷酸化。蛋白酪氨酸激酶的抑制剂可以阻断上述细胞的应答反应。
根据蛋白酪氨酸激酶在细胞内的位置可以将其分为三类:
A.蛋白酪氨酸激酶受体
这一类蛋白酪氨酸激酶为跨膜蛋白,其胞外部分为配体结合区,中间有跨膜区,胞内部分含有蛋白酪氨酸激酶的催化结构域(图21-17)。
蛋白酪氨酸激酶受体与配体结合后往往形成二聚体,继而发生酶活性的增高,使受体胞内部分的酪氨酸磷酸化增强,磷酸化的受体酶活性进一步增强。此外更重要的是,磷酸化的受体可以慕集含有SH2结构域(见后)的信号分子,从而将信号传递至下游分子。
B.位于胞浆部分的蛋白酪氨酸激酶
胞浆内亦含有多种PTKs,这些蛋白激酶或接受受体传递的激活信号,或受其它蛋白质的调节而发生活性改变,其主要作用是作为受体和最终效应分子之间的中间介导分子。已知的主要种类有:
(1)Src家族:Src、Fyn、Lck、Lyn等,与受体结合存在,当配体与受体结合后被激活;
(2)Tec家族:Btk、Itk、Tec等,与受体结合或不结合存在,配体结合后被激活;
(3)ZAP70家族:ZAP70和Syk,与磷酸化的受体结合后被激活;
(4)JAK家族:JAK1、JAK2、JAK3等。
这些PTKs或者直接与受体形成复合物,或者间接地依次被激活,在传递受体信号过程中起着接力棒的作用。它们的结构见图13。
图13 胞浆PTK的结构
C.核内蛋白酪氨酸激酶
大部分的酪氨酸蛋白激酶位于胞膜上或胞浆内,近年来却发现核内也存在着酪氨酸蛋白激酶,这对于信号在核内的传递有重要意义。重要的核内PTKs有Abl和Wee。Abl既存在于胞核内,也存在于胞浆中,已发现它参与转录过程和细胞周期的调节;Wee只存在于核内,它可调节Cyclin-2的活性,抑制其磷酸化,对细胞进入有丝分裂期具有调节作用。
(2)蛋白磷酸酶(Protein Phosphotase)
蛋白磷酸(酯)酶是指具有催化已经磷酸化的蛋白分子发生去磷酸化反应的一类酶分子。它们与蛋白激酶相对应存在,共同构成了磷酸化与去磷酸化这一重要的蛋白质活性的开关系统。正如蛋白激酶催化的磷酸化由于底物不同,有的表现为活性增高,有的表现为活性降低一样,蛋白磷酸酶所催化的去磷酸化反应也对于不同的底物有不同的反应(图14)。
图14 蛋白酪氨酸磷酸酶对蛋白酪氨酸激酶的调控作用
PTK:Protein Tyrosine Kinase PTP:Protein Tyrosine Phosphotase S:Substrate
蛋白磷酸酶的分类也与蛋白激酶类似,是根据它所作用的氨基酸残基决定的。目前已知的蛋白磷酸酶包括蛋白丝氨酸/苏氨酸磷酸酶和蛋白酪氨酸磷酸酶两大类,另外还有个别的蛋白磷酸酶具有双重作用,即可同时作用于酪氨酸和丝氨酸残基。
蛋白激酶和蛋白磷酸酶均作用于有限的底物,它们的催化作用的特异性及其在细胞内的分布特异性决定了信号转导途径的精确性。
(3)低分子量G蛋白(Small G Protein)
图15 Ras的活化及其调控因子
低分子量GTP结合蛋白在多种细胞反应中具有开关作用,它们位于MAPK系统的上游,是一类重要的信号转导分子。第一个被发现的低分子量G蛋白是Ras,因此这一类蛋白质被称为Ras超家族成员。由于它们均由一个GTP酶结构域构成,亦将之称为Ras样GTP酶。
低分子量G蛋白的共同特点是,当结合了GTP时即成为活化形式,这时可作用于下游分子使之活化,而当GTP水解成为GDP时(自身为GTP酶)则回复到非活化状态。这一点与Gα类似,但是Ras家族的分子量明显低于Gα。
在细胞中存在着一些专门控制低分子量G蛋白活性的低分子量G蛋白调节因子,这些调节因子受膜受体信号的影响,调节低分子量G蛋白活性,低分子量G蛋白再作用于MAPK系统。在这些调节因子中,有的可以增强低分子量G蛋白的活性,如鸟嘌呤核苷酸交换因子(GEF)和鸟嘌呤核苷酸解离抑制因子(GDI),有的可以降低低分子量G蛋白活性,如GTP酶活化蛋白(GAP)等(图15)。
目前已知的Ras超家族成员已超过50种,它们又可以分为数个亚家族,在细胞内分别控制不同的信号转导途径,每一个成员都有其各自的特点。
(4)介导信号转导分子相互作用的结构元件
细胞中存在着众多的信号转导分子,它们是如何相互识别、相互作用而构成不同的细胞转导途径的呢?90年代以来,人们逐步发现了在信号转导分子中存在着一些特殊的结构域。这些结构域大约由50~100个氨基酸构成,它们在不同的信号转导分子中具有很高的同源性。这些结构域的作用是在细胞中介导信号转导分子的相互识别,共同形成不同的信号传递链或称为信号转导途径(Signal Transduction Pathway),并进而形成信号转导的网络(Signal Transduction Network)。换句话讲,这些结构域像电路中的接头元件一样把不同的信号分子连接起来。这些结构域被称为调控结合元件(Modular Binding Domain)。目前已经知道了近十种这样的结构域,例如:
SH2 domain (Src Homology 2 domain)
SH3 domain(Src Homology 3 domain)
PH domain (Pleckstrin Homology domain)
PTB domain(Protein Tyrosine Binding domain)
A.SH2结构域:由约100个氨基酸组成,介导信号分子与含磷酸酪氨酸蛋白分子的结合。这种结合依赖于酪氨酸残基的磷酸化及其周围的氨基酸残基所构成的基序(motif)。
例:YEEI与Src family的SH2结合
YMXM与growth factor receptor、P13Kp85的SH2结合
YVIP与PLCγ的SH2结合
YXNX与Grb2的SH2结合
B.SH3结构域:由50~100个氨基酸组成,介导信号分子与富含脯氨酸的蛋白分子的结合,其亲和力亦与脯氨酸残基及邻近氨基酸残基所构成的基序序列相关。
例:RKLPPRPSK与P13K的亲和力为9.1μM
PALPPLPRY与P13K的亲和力为17μM
C.PH结构域:由100~120个氨基酸组成,其功能尚未完全确定。目前已知它可以与磷脂类分子PIP2、PIP3、IP3等结合。同时也发现,一些蛋白分子,如PKC和G蛋白的βγ亚单位也可以与PH结构域结合。
D.PTB结构域:由约160个氨基酸组成,与SH2一样,PTB结构域也可以识别一些含磷酸酪氨酸的基序,但其结合基序与SH2结构域有所差别。
作为调控结合元件,它们在结构和功能上有如下特点:
①一个信号分子可以含有两种以上的调控结合元件(图16),因此可以同时与两种以上的其它信号分子相结合,例如,在蛋白酪氨酸激酶Btk中即有PH结构域、SH3结构域和SH2结构域等3个调控结合元件。
图16 信号转导分子中的调控结合元件
Y-Kinase:tyrosine kinaseDBD:DNA binding domain PP:Prorich
ABD:actinbinding domainGAP: GTPase activating domain
②同一类调控结合元件可存在于多种不同的信号转导分子中,例如,PH结构域存在于某些蛋白激酶、低分子量G蛋白调节分子及细胞骨架蛋白等多种信号转导分子中。这些调控结合元件的一级结构仍然是不同的,因此对所结合的信号分子具有选择性,这是保证信号分子相互作用具有特异性的基础。
③这些结构域本身均为非催化结构域。
2.两条典型的信号转导途径
(1)表皮生长因子受体介导的信号转导途径
表皮生长因子与其受体-表皮生长因子受体结合后可引发一系列细胞内变化,最终使细胞发生分化或增殖。表皮生长因子受体是一种受体酪氨酸蛋白激酶,而受体酪氨酸蛋白激酶→Ras→MAPK级联途径是表皮生长因子刺激信号传递到细胞核内的最主要途径。它由以下成员组成:表皮生长因子受体→含有SH2结构域的接头蛋白(如Grb2)→鸟嘌呤核苷酸释放因子(如SOS)→Ras蛋白→MAPKKK(如Raf1)→MAPKK→MAPK→转录因子等(图17)。
图17 EGF受体介导的信号转导过程
表皮生长因子与受体结合后,可以使受体发生二聚体化,从而改变了受体的构象,使其中的蛋白酪氨酸激酶活性增强,受体自身的酪氨酸残基发生磷酸化,磷酸化的受体便形成了与含SH2结构域的蛋白分子Grb2结合的位点,导致Grb2与受体的结合。Grb2中有两个SH3结构域,该部位与一种称为SOS的鸟苷酸交换因子结合,使之活性改变,SOS则进一步活化Ras,激活的Ras作用于MAPK激活系统,导致ERK的激活。最后ERK转移到细胞核内,导致某些转录因子的活性改变从而改变基因的表达状态及细胞的增殖与分化过程。
(2)γ-干扰素受体介导的信号转导
γ-干扰素是由活化T细胞产生的,它具有促进抗原提呈和特异性免疫识别的作用,并可促进B细胞分泌抗体。γ-干扰素与受体结合以后,也可以导致受体二聚体化,二聚体化的受体可以激活JAK-STAT系统,后者将干扰素刺激信号传入核内。JAK(Janus Kinase)为一种存在于胞浆中的蛋白酪氨酸激酶,它活化后可使干扰素受体磷酸化。STAT(Signal Transducerand Activator of Transcription)可以通过其SH2结构域识别磷酸化的受体并与之结合。然后STAT分子亦发生酪氨酸的磷酸化,酪氨酸磷酸化的STAT进入胞核形成有活性的转录因子,影响基因的表达(图18)。
图18 γ-干扰素受体介导的信号转导过程
JAK:Janus kinase
STAT: Signal Transducer and Activator of Transcription
GAS: γinterferonactivated sequence element
上述两条信号转导途径仅仅是多种信号转导途径的代表,尽管90年代以来科学家们在细胞信号转导的分子机理研究方面已经取得了一些成就,但距离阐明细胞中存在的全部传递网络系统还十分遥远,有待科学家们不断努力,在下个世纪实现人类认识自我的愿望。
基因诊断
基因诊断与基因治疗
(Gene Diagmosis and Gene Therapy)
基因诊断
医生需要综合患者的病史,症状,及各种检查的结果作出临床诊断。随着人们对疾病的病因及发病机理的认识的不断深入,临床检查的手段也在不断进步。目前看来,绝大多数疾病的发生,发展都与患者遗传背景或者其改变有关,所以临床上越来越有必要检查这种变化。这种用分子生物学方法检测患者体内遗传物质的水平或结构变化而作出的或辅助临床诊断的技术,称为基因诊断。
一、基因诊断的对象
1、病原生物的侵入:一般侵入体内的病原生物可通过显微镜检查各免疫学方法进行诊断。但是,直接检测病原生物的遗传物质可以大大提高诊断的敏感性。而肝在无法得到商业化抗体时,基因诊断就成为检测病原微生物感染,尤其是病毒感染的唯一手段。此外,由于基因碱基配对原理的基因诊断可直接检测病原微生物的遗传物质,所以诊断的特异性也大为提高。目前,基因诊断已在病毒性肝炎,受滋病等传染病的诊断中发挥了不可代替的作用。
2、先天遗传性疾患:已有多种传统的遗传性疾患的发病原因被确定为特定基因的突变。例如:苯丙氨酸羟化酶基因突变可引起苯丙酮尿症:腺苷脱胺酶基因突变可引起重症联合免疫缺陷症(SCID);而淋巴细胞表面分子CD40或其配体(CD40L)基因突变则可引起无丙种球蛋白血症。这类疾病的诊断除了仔细分析临床症状及生化检查结果外,从病因角度作出诊断则需要用基因诊断的方法检测其基因突变的发生。此外,有些病因尚不清楚的疾病,如高血压、自身免疫性疾病等,都可能与某个或某些遗传位点的持有或改变有并。用基因诊断的方法检测这些位点的改变,不仅对临床诊断,而且对疾病的病因和发病机理的研究都具有重要的意义
3、后天基因突变引起的疾病:这方面最典型的例子就是肿瘤。虽然肿瘤的发病机理尚未完全明了,但人们可以初步认为肿瘤的发生是由于个别细胞基因突变而引起的细胞无限增殖。无论是抑癌基因发生突变还是癌基因发生突变,如果确定这些改变的发生,都必须进行基因诊断。
4、其它:如DNA指纹、个体识别,亲子关系识别,法医物证等。
二、基因诊断的方法
与疾病相关的遗传背景改变主要有两类,一是遗传物质,即DNA或RNA的水平的变化。例如病毒感染量病毒基因及其转录产物在人体内的从无到有,某些肿瘤中癌基因表达水平的从低到高。二是遗传物质的结构变化,即基因突变,如点突变引起的基因失活,及染色体转位引起的基因激活或灭活等等。所以从理论上说所有检测基因水平或结构的方法都应可用于基因诊断。但如考虑其临床适用性,灵敏度等问题,下列几种方法可看作是有应用前景的基因诊断的方法。
1、核酸杂交:酸杂交是从核酸分子混合液中检测特定大小的核酸分子的传统方法。其原理是核酸变性和复性理论。即双链的核酸分子在某些理化因素作用下双链解开,而在条件恢复后又可依碱基配对规律形成双边结构。杂交通常在一支持膜上进行,因此又称为核酸印迹杂交。根据检测样品的不同又被分为DNA印迹交(Southern blot hybridization )和RNA印迹杂交(Northern blot hybridization)。其基本过程包括下列几个步骤。
(1)制备样品:首先需要从待检测组织样品提取DNA或RNA。 DNA应先用限制性内切酶消化以产生特定长度的片段,然后通过凝胶电泳将消化产物按分子大小进行分离。一般来说DNA分子有其独特的限制性内切酶图谱,所以经酶切消化和电泳分离后可在凝胶上形成特定的区带。再将含有DNA片段的凝胶进行变性处理后,直接转印到支持膜上并使其牢固结合。这样等检测片段在凝胶上的位置就直接反映在了转印在膜上。RNA样品则可直接在变性条件下电泳分离,然后转印并交联固定。
(2)制备探针:探针是指一段能和待检测核酸分子依碱基配对原则而结合的核酸片段。它可以是一段DNA、RNA或合成的寡核苷酸。在核酸杂交实验中,探针需要被标记上可直接检测的元素或分子。这样,通过检疫与恩印膜上的核酸分子结合上的探针分子,既可知道被检测的核酸片段在膜上的位置,也就是在电泳凝胶上的位置,也就知道了它的分子大小。
(3)杂交:首先要进行预杂交,即用非特异的核酸溶液封闭膜上的非特异性结合位点。由于转印在膜上的核酸分子已经是变性的分子,所以杂交过程中只需变性标记好的探针,再让探针与膜在特定的温度下反应,然后洗去未结合的探针分子即可。
(4)检测:检测的方法依标记探针的方法而异。用放射性同位素标记的探针需要用放射自显影来检测其在膜上的位置;而如果是用生物素等非同位素方法标记的探针则需要用相应的免疫组织化学的方法进行检测。
2、聚合酶链反应:核酸杂交反应是一对一的反应,即膜上有一个被检测分子时,相应就有一个标记的探针分子与它杂交。所以整个实验敏感性主要取决于标记探针的质量和杂交后的检测方法。在优化的条件下,核酸杂交可检测到pg水平的靶分子,约相当于106个分子。但是,在许多临床情况下,即无法得到这样的品量。这时可以用聚合酶链反应来扩增靶分子以特异性地增加靶分子量,达到提高敏感性的目的。
聚合酶链反应(polymerase chain reaction ,PCR)的反应本身是在同一试管内利用DNA聚合酶催化的反应反复进行同一段DNA片段的合成(图1)。聚合酶反应的模板是待检测核酸分子:DNA可直接用于反应,而RNA则需要用反转录酶反转录成为cDNA,然后用作聚合酶反应的模板。反应的引物有两条,分别位于待扩增DNA片段的两端,可启动相对方向的DNA合成。这样从一个模板分子起始的话,经过n次聚合酶反应后就可以合成2n个模板分子。假如进行了30轮反应,则可从一个待检分子合成出230,即约109个待检分子。对于一段500碱基对的DNA片段来说,这大约等于1ng的DNA。所以从很小时的样品即有可能扩增出电泳后肉眼可见的产物。
最初的聚合酶链反应是用DNA聚合酶I的Klenow片段或T4 DNA聚合酶催化的。但是由于每轮反应都需要三个温度点,尤其是模板变性需在较高的温度下进行,所以最初的PCR需要在每轮反应中加入DNA聚合酶。这个问题在发现了耐热DNA聚合酶(Taq DNA聚合酶)后才得以完满的解决。Taq DNA聚合酶分离自水栖高温菌,其最适反应温度为75-80摄氏度,且经90摄氏度以上的加温后仍可在温度恢复后复性。所以这种酶特别适合于在不同温度点进行循环加温与降温而不丧失酶的活性。因此被广泛应用于各种PCR。
图1 RCP的基本原理
下面以爱滋病的临床检测为例,简要说明一下PCR在病毒感染的基因诊断中的应用。
组织中总RNA的提取
↓
利用反转录酶合成cDNA
↓
PCR反应:
反应液组织:反应缓冲液
模板(上述合成的cDNA)
底物(dATP,dGTP,dCTP,dTTP)
引物(爱滋病病毒特异性引物)
TaqDNA聚合酶
50μl
循环:95℃,30sec(变性)
↓
55℃,1min(退火)30循环
↓
72℃,1min(聚合)
检测:电泳或核酸杂交
基因治疗?Gene?Therapy
许多疾病如遗传性疾病、肿瘤等与人体的基因异常有密切的因果关系。早在DNA重组技术之前就有人提出将正常基因顺序导入病人体内进行基因水平治疗的设想。Edward Tatum 和Joshua Lederberg 在60年低曾提出可利用病毒作为基因转移的载体。但直到1990年才成功地实现了用基因治疗手段尝试治疗腺苷酸脱氨酶缺乏症(adenosine deaminase deficiency)。到目前为止,已报道的基因治疗方案已超过百种。有300多病人接受了这种新的治疗方式。基因治疗的对象不再局限于遗传病,而被扩展到肿瘤和传染病等多种疾病。其发展相当迅速,前景十分看好,我国学者也在用基因治疗方式治疗血友病方面做了一定工作。目前已积累了一定的经验和教训,有了一些可遵循的操作程序及可供选择的治疗方式。但这种新的治疗方式仍有许多环节需要不断改进和提高。
一、基因治疗的概念和策略
基因治疗(gene therapy)就是用正常或野生型(wild type)基因较正或置换致病基因的一种治疗方法。在这种治疗方法中,目的基因被导入到靶细胞(target cells)内,他们或与宿主细胞(host cell)染色体整合成为宿主遗传物质的一部分,或不与染色体整合而位于染色体外,但都能在细胞中得到表达,起到治疗疾病的作用。
目前基因治疗的概念了较大的扩展,凡是采用分子生物学的方法和原理,在核酸水平上开展的疾病治疗方法都可称为基因治疗。随着对疾病本质的深入了解和新的分子生物学方法的不断涌现,基因治疗方法有了较大的发展。根据所采用的方法不同,基因治疗的策略大致可分为以下几种:
基因置换(gene replacement):基因置换就是用正常的基因原位替换病变细胞内的致病基因,使细胞内的DNA完全恢复正常状态。这种治疗方法最为理想,但目前由于技术原因尚难达到。
基因修复(gene correction):基因修复是指将致病基因的突变碱基序列纠正,而正常部分予以保留。这种基因治疗方式最后也能使致病基因得到完全恢复,操作上要求高,实践中有一定难度。
基因修饰(gene augmentation)又称基因增补,将目的基因导入病变细胞或其它细胞,目的基因的表达产物能修饰缺陷细胞的功能或使原有的某些功能得以加强。在这种治疗方法中,缺陷基因仍然存在于细胞内,目前基因治疗多采用这种方式。如将组织型纤溶酶原激活剂的基因导入血管内皮细胞并得以表达后,防止经皮冠状动脉成形术诱发的血检形成。
基因失活(gene inactivation):利用反义技术能特异地封闭基因表达特性,抑制一些有害基因的表达,已达到治疗疾病的目的。如利用反义RNA、核酶或肽核酸等抑制一些癌基因的表达,抑制肿瘤细胞的增殖,诱导肿瘤细胞的分化。用此技术还可封闭肿瘤细胞的耐药基因的表达,增加化疗效果。
免疫调节(immune adjustment):将抗体、抗原或细胞因子的基因导入疾人体内,改变病人免疫状态,达到预防和治疗疾病的目的。如将白细胞介素-2导入肿瘤病人体内,提高病人IL-2的水平,激活体内免疫系统的抗肿瘤活性,达到防治肿瘤复发的目的。
其它:增加肿瘤细胞对放疗或化疗的敏感性:采用给予前体药物的方法减少化疗药物对正常细胞的损用力。如向肿瘤细胞中导入单纯疱疹病毒胸苷激酶基因,然后给予病人无毒性GCV药物,由于只有含HSV-TK基因的细胞才能将CGV转化成有毒的药物。因而肿瘤细胞被杀死,而对正常细胞无影响。
总之,基因治疗的策略较多,不同的方法在实践中各具有优缺点。而基因的治疗本身也并不局限于遗传病的治疗,现已扩展到肿瘤、病毒性疾病等。基因治疗可用于疾病的治疗,也可用于疾病的预防。应该指出的是基因治疗并不是万能的,尚不能取代现有的治疗方法,作为一种新的方法也还有一些需进一步完善的地方,在实践是应相互结合,取长补短,以取得较好的治疗效果。
一些常见疾病的治疗策略见表1。
表1 基因治疗策略
遗传性疾病
--隐性遗传病
--用正常基因置换致病基因而达到完全校正
--导入正常基因序列以达到暂时性校正
--显性遗传病
--用正常基因置换致病基因而达到完全校正
--使有害基因失活而达到暂时性校正(如用反义技术、核酶等)
--在某些情况下可导入正常基因加以校正(如LDL受体)
肿瘤
--杀伤肿瘤细胞(如利用自杀基因,激活免疫系统及保护正常细胞免受化疗药物的损伤等)
--使癌基因失活(反义技术、核酶)或增加抑癌基因的表达
传染病
--杀伤传染源(免疫法、自杀基因)
--使传染源失活(反义技术、核酶、核酸陷井)
其它疾病
--导入药物基因(药物释放)如激素、细胞因子
--失活有害基因产物(反义技术、核酶、核酸陷井)
--杀伤策略如减少特异细胞群
二、基因治疗的基本程序
基因治疗是在基因工程基础上发展起来的分子生物学技术,它相对于现有其它治疗方法较为复杂。基因治疗的基本过程包括以下主要方面:
(一)目的基因的选择和制备
基因治疗的首要问题是选择用于治疗疾病的目的基因。对遗传病而言只要已经研究清楚某种疾病的发生是由于某个基因的异常所引起的,其野生型基因就可被用于基因治疗,如用ADA基因治疗ADA缺陷病。但在现在的条件下,仅此是不够的。可用于基因治疗的基因需满足以下几点:在体内仅有少量的表达就可显著改善症状;该基因的过高表达不会对机体造成危害。很显然某些激素类基因如与血糖浓度相关的胰岛素基因目前尚不能用于糖尿病的基因治疗。在抗病毒和病原体的基因治疗中。所选择的靶基因应在病毒和病原体的生活史和起重要的作用并且该序列是特异的,如针对HBV的HBeAg或X基因等。肿瘤病人多有免疫缺陷,可选用免疫因子基因转入人体,肿瘤细胞内往往存在多种基因异常形式,可采用反义技术封闭细胞内活化的癌基因或向细胞内转入野生型抑癌基因,抑制肿瘤生簪,所针对的癌基因或抑癌基因应下该肿瘤的发生和发展有明确的相关性。
在确定欲选目的基因后,就在制备目的基因。正向表达的基因可以是cDNA(complementary DNA),也可是基因组DNA(genomic DNA)片段。可用传统的方法获取,也可采用多聚酶链式反应(polymerase chain reaction PCR)等新技术进行体外扩增。部分反义基因也可采用此法获得,但多数情况下采用人工合成的方式制备。???
(二)基因的转运
目前已有多种基因转运的方式,其基本原则是将外源基因运到细胞内。已使用的有病毒载体和非病毒载体两大类。
病毒载体:病毒具有一些独特的性质如多数病毒可感染特异的细胞,在细胞内不易降解;RNA病毒能整合到染色体以及基因水平较高等。因此病毒载体是良好的基因转运载体。目前已被用作载体的病毒有逆转录病毒、腺病毒、腺相关的病毒。疱疹病毒和肝炎病毒等。逆转录病毒用作载体时需进行几步改造:(1)将天然的野生型RNA前病毒转变成DNA载体,并插入欲转移的相关外源基因。其基本原则是用标记基因和外源基因替代病毒的编码基因,如图1所示。(2)制备辅助细胞为载体DNA提供其丧失的功能,如图2所示。(3)将载体DNA导入辅助以产生病毒载体。如图3。(4)病毒载体感染靶细胞,外源基因在细胞内得以表达,如图4所示。
STEP 1
INSERTING FOREIGN DNA INTO THE RETROVIRAL PROVIRUS
Wild-Type Provirus
图1 Scientists use recombinant DNA techniques to replace the gag,pol,and env genes with one or more foreign genes.The foreign genes can be inserted in several different patterns.in this example,a selectable marker gene(neo)replaces the viral gag and pol genes and? a human gene replaces the env gene.
STEP 2
MAKING THE HELPER CELL
Desiging the Helper Vius
图2 The helper cell should meet two basic requirements:(1)it should provide functions missing from the the vector virus,and(2)it should not be capable of producing viable virus particles. The crucial element in the development of a successful helper cell is the design of the helper virus. Researchers use recombinant DNA techniques to disable the helper virus in the test tube-one of the most common measures is removal of the Psi fragment. The Psi-deficient helper virus produces all of the normal viral proteins, but cannot package its own RNA because it lacks the appropriate packaging signal. Helper virus DNA is inserted into the genome of the helper cell using chemical techniques.
STEP 3
PRODUCING THE VECTOR
图3 Scientists use chemical measures or an infection technique to insert recombinant vector DNA (including a human gene) into helper cells. Because the vector provirus contains the Psi sequence, the vector RNA genome is automatically encapsulated by viral proteins produced by helper virus DNA in the helper cell. The resulting viral particles are released by budding from the helper cell membrane. The vector virus is capable of only one infection because it lacks the information needed to make viral proteins.
STEP 4
INFECTING THE TARGET ELL
图4 Researchers infect target cells (such as human bone marrow cells) with the vector virus in two different ways: they mix them with helper cells producing the virus, or they bathe them in fluid harvested from the helper cell culture. When the vector provirus is integrated into the target cell DNA ,enzymes from the target cell treat it as an integral part of the genome. Cellular enzymes do the work necessary to make proteins from the foreign genes located between the two viral L TRs.
非病毒载体:这类载体的发展较快,目前主要是脂质体,一些具有受体功能的载体也呈现出诱人的前景,关于常见载体的优缺点列于表2。
表2 常见基因转运载体的优缺点
载体
优点
缺点
逆转录病素毒
基因组小并且简单
可稳定整合于宿主基因组
生物学特性清楚
可高效转入复制中的细胞
对宿主细胞无害
仅感染分裂细胞
随机整合(可能导致突变)
常常只有短暂表达
病毒滴度低(107pfu/ml)
可能会与有复制能务的病毒重组插入容量有限(10kb)
腺相关病毒
基因组小(5kb)
可特异整合于人19号染色体
以人细胞作为宿主
无毒、无致病性
尚未研究清楚
需腺病毒辅助复制
携带外源基因能力有限(4kb)
难得到高滴度病毒
腺病毒
适于原位使用,尤其是肺
(在不分裂细胞中可进行高效率的体内感染)
病毒滴度高(1010pfu/ml)
生物学特性清楚
不与宿主基因组整合(只有短暂表达)
载本基因组复杂
病毒蛋白可能引起免疫反应及炎症反应
插入外源基因能力有限(7-8kb)
脂质体
无感染能力
理论上无DNA大小限制
毒性低
无特异性靶细胞
转染效率低
仅有短暂表达
体内应用困难
受体介导的转运
无感染能力
特异性转染靶细胞
理论上无DNA大小限制
构建灵活
转染效率低
体内应用困难
可能有免疫原性
只有短暂表达
(三)靶细胞的选择
?理论上讲,无论何种细胞均具有接受外源DNA的能力,目前基因治疗中禁止使用生殖细胞作为靶细胞,而只能使用体细胞,用于转基因的体细胞必须取材方便,含量丰富,容易培养,寿命较长。可选择的细胞有淋巴细胞、造血细胞、上皮细胞、角质细胞、内皮细胞、成纤维细胞、肝细胞、肌肉细胞和肿瘤细胞等。在实际上应用中应具体根据目的条件选择。
(四)细胞转染(tansfection)
将目的基因导入靶细胞的方法很多,大致可分为物理学方法、化学方法、融合法和病毒感染法四类。病毒法已在本节的“基因的转运”中有基因介绍。目前较多使用的是脂质体法。
表3 DNA导入哺乳动物细胞常见的方法
名称
机制
转染效率
用途
优缺点
影响因素
磷酸钙转染法
内吞作用
20%细胞被转染
瞬时表达
1、简单有效
2、适用于贴壁、非贴壁细胞
3、常作首选方法
1、Ca2+,DNA浓度
2、PH值,沉淀反应时间
3、氯喹,甘油和丁酸钠处理
DEAE葡聚糖转染法
抑制核酸酶
内吞作用
在BDC-1,CV-1和COS细胞中较高
瞬时表达
操作简单
1、需高浓度DNA
2、DEAE葡聚糖浓度
3、温育时间
Poly-brene转染法
不清楚
低分子量DNA转染率高于磷酸钙法
CHO细胞的稳定转化子
能得到较多的稳定转化子
1、受体细胞类型
2、转染调控信号
3、DNA浓度
原生质体融合
胞膜融合
50-100%转染,稳定子得率为0.2-0.02%
瞬时表达
稳定表达
1、操作复杂
2、不能进行共转染
3、慎用于筛选营养缺陷型变异株
1、溶菌酶、PEG浓度
2、温育时间
电穿孔
高压在膜上形成微孔
效率较高
瞬时表达
稳定转化
1、需精密仪器
2、可用于动物、植物细胞和细菌
1、电场强度
2、脉冲长度
3、温度,DNA浓度
4、培养液
脂质体
脂膜融合
50-60%转染
瞬时表达
稳定转化
1、操作简单
2、可用于体内试验
1、脂质体质量
2、DNA浓度
胞核微注射法
直接注射
50-100%转染
稳定转化
1、需要特殊仪器
2、处理样品数量少
3、高效
1、注射技术
2、DNA浓度
在目前的技术状态下,一般而言其基因转染效率很难达到100%。故必须首先将转导细胞和未转导细胞加以区分。这方面的新技术发展很快,常用的转导细胞筛选方法有:
利用基因表达产物筛选法:(1)标记基因筛选法:在载体上引入一个标记基因,或同时导入标记基因,在转染后的适当时间选用合适剂量的选择培养基,筛选标记基因表型,那些已导入外源基因的细胞将存活下来,而未转录的细胞则死于选择性细胞培养基。如在较多的载体中都有neor标记基因存在,若向培养基中加入G418进行选择,最后只有转导细胞存活下来。(2)基因缺陷型受体细胞的选择性:以基因缺陷型细胞作为靶细胞,将正常基因导入基因缺陷型靶细胞后,使用选择性培养基进行筛选。例如将TK基因导入TK-的靶细胞,转录细胞可在HAT培养基中生长,未转导的细胞则不能在HAT培养基中生长。(3)基因共转染技术:将目的基因表达载体DNA和标记基因表达载体DNA混合后共同转移到靶细胞中,分别使用标记基因和目的基因对应的选择剂进行两次筛选,最后得到复合转导的转化子。
分子生物学方法:外源基因是否真的转入靶细胞必须用分子杂交方法进行证实。常用的方法有原位杂效,Southern杂交和打点杂交。其中主要问题是探针的选择。若靶细胞内原来不存在所转入的目的基因,可选用目的基因作为探针;靶细胞内一般无标记基因存在,故标记基因是良好的探针。探针大小可以是较大的DNA片段,亦可是人工合成的DNA单链探针分子。PCR方法目前也已用于转导细胞的鉴定,且该法相对简单易行。
(五)外源基因的表达及检测
在筛选出转化分子后还需要鉴定转导细胞中外源基因的表达状况。其中包括对目的基因和标记基因表达的鉴定。常用方法有原位杂交,Northrn杂交,NRA打点杂交,免疫组织化学染色等,前几项是检测外源基因转录出的mRNA,后者则是检测外源基因翻译出的蛋白质。流式细胞仪是一种较为客观准确的仪器,可定量分析外源基因的表达状况。
一些影响基因表达的因素如表4所示。???
表4 调节重组细胞表达系统的DNA控制元件
启动子
病毒启动子:如LTRS,CMV,SV40启动子在短时间后易于关闭,尤其是在逆转录病毒中
看家基因启动子:如二氢叶酸还原启动子可长期表达转基因,但水平很低。
组织/细胞特异性启动子:一些编码含量丰富蛋白的基因的启动子如肌肉中肌酸激酶的启动子能够进行特异性强表达
可诱导启动子:如金属硫蛋白基因的启动子,类固醇诱导的启动子可调节基因表达
其它调节转录的顺式作用调节元件
增强子,位点控制元件,内含子序列及编码序列本身可影响基因表达调节。
影响转录后表达的序列
3’-mRNA序列:对于稳定mRNA及进行翻译可能是必需的。
三、基因治病的靶向
基因治疗中的靶向问题是基因治疗中急待解决的问题。逆转录病毒载体是目前治疗中应用较为广泛且效果较好的载体。有关逆转录病毒靶向的研究已取得一些进展,使得基因治疗更为安全和有效。
(一)逆转录病毒转导的细胞类型的选择调节
Mo-HLV是一个可广泛转导多种细胞的病毒,为了使其仅感染某些专一性细胞就必须改变其感染谱。
1、改变Mo-HLV感染谱
按宿主范围可将Mo-HLV分为三类:单向性:只能感染啮齿类细胞;异向性:可感染除啮齿类动物细胞以外的其它的细胞;双向性:可感染人及啮齿类动物等大多数细胞。感染细胞的类型是由病毒的外壳蛋白env确定的。
(1)病毒与抗体的偶联:为了使逆转录病毒定向感染所需要的靶细胞,可将病毒与抗体偶联,该抗体则针对所需感染细胞上特有的抗原。如使单向感染病毒与抗人MHC-1。MHC-II的抗体偶联或与抗人表皮生长因子的抗体偶联后,可以感染人类细胞。Goud等使用此法使单向病毒感染人的肝细胞,可惜病毒未能整合入肝细胞基因组,可能其中还有其它原因。
(2)病毒外壳蛋白与配体偶联:? 如将env蛋白与乳糖偶联成去延酸糖蛋白,用此法改造的单向逆转录病毒将不再感染原先的宿主而只感染人的肝细胞,因为只有肝细胞表面上含有去延酸糖蛋白的受体。
(3)改变病毒外壳蛋白的识别序列:已发现env蛋白与被感染细胞受体相识别部位的化学组成,如果改变核表位的基因序列,就可能改变感染细胞的类型,但Etienne等认为有一个潜在的、非病毒原有的表位与细胞受体识别之后不能使病毒内化。一种可行的方法是同时表达原有的env蛋白,就能解决内化问题。
2、使用其它逆转录病毒载体:
牛白血病逆转录病毒,猿免疫缺陷病毒,鼠乳腺肿瘤病毒有组织专一性感染的特点,有些研究组利用其作为载体。Page等采用HIV作为病毒载体,Rizvi等用BLV作载体,Morris等采用MMTV作载体,并构建了MMTV独特的包装细胞,使病毒滴度提高百倍以上,但同Mo-MLV相比,其它病毒的滴度偏低。
3、以嵌合逆转录病毒为载体
逆转录病毒感染谱是由病毒颗粒决定的,如果我们改变病毒颗粒蛋白,即保留毒gagpol基因,而env基因来自另一个逆转录病毒,即可改变感染宿主范围。Laudau等用鸟逆转录病毒和RSV的env基因取代 Mo-MLVR env基因,Miller等用长臂猿白血病病毒的env基因嵌合 Mo-MLVR成功感染了多种细胞,并取得较高的滴度,Gong等用流感病毒的血凝素取代RSV的env基因蛋白,将血凝素成功地嵌入病毒外壳,并能有效感染人和鸟类细胞。Jane等用泡状口炎病毒G糖蛋白取代莫洛尼病毒env蛋白,使该病毒颗粒能成功地感染非哺乳动物如Zebra fish细胞,更重要的是这种病毒外壳可耐受超离心而不影响感染效率,因此有利于浓缩病毒,提高滴度。
(二)目的基因组织专一性表达的调节
许多组织专一性表达的调节片段已研究清楚,把这些片段与目的基因一起重组入逆转录病毒可用于基因的靶向表达。
1、肝专一性表达
肝专一性表达研究较多的是磷酸烯醇式酮酸羧激酶的启动子。McGrane? 等用了转基因动物技术使该启动子表达外源基因,证明该启动子专一性地在肝和肾等中表达;Hatzoglau等用PEPCK启动子与neo基因或牛生长因子重组入逆转录病毒载体。克隆后经腹腔注射入子宫感染鼠胎肝或注入门静脉并切除部分肝,证实前病毒可整合肝细胞基因组,并持续表达了八个月之久,而且牛生长因子表达量受食物刺激信号的调节。
另一个肝专一性表达的片段是A-胰蛋白酶基因的顺式作用因子。Simon等的研究表明,α-AT基因上游是决定肝专一性表达的片段,(-137~37)为最短的肝专一性表达的片段。Peng等用α-AT的(-730-30)片段与SV40启动子融合驱动人苯丙氨酸羟化酶基因,使其在肝脏专一性表达,为苯丙酮尿症基因治疗奠定了基础。
α-FP为肝癌细胞特有的高效表达产物,Watanabe等发现其上游调控区(-3700~3300)决定了α-FP在肝癌中的专一性表达。Huber等将片段与你腺嘧啶激酶基因融合,克隆入逆转录病毒后转染肝细胞,然后给予无毒性原药-阿拉伯糖核苷,只有肝癌细胞才专一性地合成TK,批ara-MF转化成细胞毒性ara-ATP,造成肝癌细胞的死亡,而其它感染了α-EF-TK的细胞不受影响。
2、肌肉专一性表达
肌肉中高效表达的是肌苷激酶的调控片段。Johnson等发现MCK调控区有两个增强子:一个位于(-1256~1049),决定肌肉和心肌专一性表达,另一个位于第一内含子(738~1599),只决定在心肌的高效专一性表达。Cox等用这两个增强子使Dystrophin在肌肉的表达量增强50倍,完全纠正了mdr鼠肌肉病理变化,而且无付作用,最近,Yao等用2分MCK增强子(-1350~1048)使人凝血因子IX在肌母细胞中得到高效表达。
3、乳腺专一性表达
在乳腺中专一性表达的基因有β酪蛋白,乳清酸蛋白,鼠乳腺肿瘤病毒,三都调控区中的负调控片段决定他们仅在乳腺组织中表达。
4、黑色素瘤专一性表达
黑色素瘤特异性表达酪氨酸和酪氨酸相关蛋白。决定酪氨酸专一性表达的片段是在该基因上游(-270~1),决定TRP-1专一性表达的区域为(-640~165),Hart等用上述调控区与Gal报告基因融合,在人与鼠的黑色素瘤细胞中均检测到其表达。
5、胶质瘤专一性表达
目前已知鞘磷酸碱性蛋白基因上游(-1300~1)片段决定其在胶质瘤细胞中的专一性表达,Miyao等用该片段与HTK基因融合,转染胶质瘤细胞,在1μMganciclovir培养液中,90%胶质瘤细胞死亡,而对照组生长不受影响。
6、肺癌专一性表达
人表面活性蛋白A是大多数肺癌表达的物质。Smith 等用SPA-1上游(-2600~178)片段驱动HSV-TK基因,转化肺癌细胞株H441 ,给予ganciclovir后,H441大量死亡。