第十一章 微生物和基因工程
11.1 概述
自从分子生物学家发现所有生物的遗传信息都是由DNA分子携带并发现了基因的密码后,人们就一直致力于将分子生物学的这一划时代成果用于微生物细胞的改造,使得微生物细胞能够结累更多的目标产物、合成新的代谢产物及转化原本不能转化的底物或有毒物质。通过科学家们的不懈努力,基因工程已经成了工业微生物菌种选育的重要手段,正在发酵工业中发挥愈来愈大的作用。可以说工业微生物遗传育种取得的重要进展是基因工程发展的基础之一,现在又为工业微生物的育种提供了新的、有力的工具。两者始终存在着十分密切的依赖关系。
基因克隆是重组DNA技术的关键步骤。这里,基因定义为细胞的染色体中含有遗传信息的基本单元。在对基因进行操纵之前,必须对DNA分子的脱氧核糖核酸顺序、各个结构单元的功能及其相互关系有一个清楚的认识,即所谓的基因组。目前,许多微生物、植物、动物及人类基因组计划已经完成或即将完成,怎样利用从基因组中获得的大量信息为人类服务已经成了生物技术的重要研究内容和发展方向。但是这些基因组、特别是人类基因组太复杂,很难讲清楚其功能和组织。因此本章将只讨论最简单的基因组为例对DNA分子的核苷序列分析和结构基因的获得进行简要讨论。
早在1978年猴子病毒SV40的DNA分子的核苷序列就已经完全清楚,它有5,243个碱基对,这些碱基对构成了五个结构基因。限制性内切酶(Restriction endonuclease)对基因序列分析作出了巨大的贡献,限制性内切酶是一类从细菌中分离得到的能够将DNA分子在特定的位点进行切断的酶。限制性内切酶的功能是将一个很大的DNA分子切割成许多良好定义的碎片,以便进一步研究。目前已经从约250种细菌中提纯出了500余种限制性内切酶。其中典型的如从大肠杆菌得到的EcoRI,专门作用于GAATTC核苷序列;又如从白色短小杆菌(Brevibacterium albidum)得到的BalI则专门切断TGGCCA核苷序列。
限制性内切酶切断双股DNA分子时有如图11.1.1所示的两种方式:
T G G C C A G A A T T C
A C C G G T C T T A A G
T G G C C A G A A T T C
A C C G G T C T T A A G
(b)
图11.1.1 限制性内切酶的两种切断方式:(a)平端,(b)粘性末端
沿对称线切断形成两个平端分子(图11.1.1a)。
在对称线附近沿对称位置切断形成两个含粘性末端(Sticky ends)的分子(图11.1.1b)。这种方式都在重组DNA技术中使用。
限制性内切酶的类型和主要特性列于表11.1.1,其它在重组DNA中常用的核酸酶见表11.1.2。
由于限制性内切酶所能识别的核苷序列是唯一的,因此在一个DNA分子中的切割位点有限。被切割下来的DNA碎片的分离时需要应用一项非常有用的技术:凝胶电泳。然后就能进一步研究每个DNA碎片的结构和功能。利用不同的限制性内切酶反复进行上述过程,就能够最终确定DNA分子的核苷序列和鉴别它所包含的结构基因。现在已经有了全自动DNA测序仪,利用这类仪器可以大大提高核苷序列分析的速度。此外现在已经建立了各种基因库,将分析得到基因核苷序列与基因库中已知结构基因的核苷序列进行比较就能够确定该基因是那一种结构基因或者是新发现的基因。
表11.1.1核酸内切限制酶的类型和主要特性
酶
识别序列
同裂酶
同尾酶
切割位点数目
(
SV40
pBR322
Aval
C(PyCGPuG
SalI,XhoI,XmaI
8
0
1
BamHI
G(GATCC
BstI
BclI,BglII,MboI,
Sau3A,XhoII
5
1
1
BclI
T(GATCA
BamHI,BglII,MboI,
Sau3A,XhoII
7
1
0
BglII
A(GATCT
BamHI,BclII,MboI,
Sau3A,XhoII
6
0
0
ClaI
AT(CGAT
AccI,AcyI,AsYII,
HpaII,TaqI
15
0
1
EcoRI
G(AATTC
5
1
1
EcoRII
(CC(A/C)GG
AtuI,ApyI
>35
16
6
HaeIII
GC(CC
BspRI,BsuRI
>50
19
22
HgaI
GACGC(N)5(
CTGCG(N)10(
>50
0
11
HhaI
GCG(C
FnuDIII,HinPI
>50
2
31
HincII
CTPy(PuAC
HindII
34
7
2
HindII
GTPy(PuAC
HincII,HinJCI
34
7
2
HindIII
A(AGCTT
HsuI
6
6
1
HinfI
G(ANTC
FnuAI
>50
10
10
HpaI
GTT(AAC
13
4
0
HpaII
C(CGG
HapII,MnoI
AccI,AcyI,AsuII,
ClaI,TaqI
>50
4
12
HphI
GGTGA(N)6
(CCACT(N)7
>50
4
12
KpnI
GGTAC(C
BamHI,BclI,BglII,
XhoII
2
1
0
MboI
(GATC
DpnI,Sau3AI
>50
8
22
PstI
CTGCA(G
SalPI,SfII
18
2
1
PvuII
CAG(CTG
15
3
1
SacII
CCGC(GC
CscI,SstII
>25
0
0
SalI
G(TCGAC
HgiCIII,HgiDII
AvaI,XhoI
1
0
0
Sau3A
(GATC
MhoI
BamHI,BclI,BglII,
boI,XhoII
>50
8
22
SmaI
CCC(GGG
XmaI
3
0
0
SstI
GAGCT(C
SacI
2
0
0
XbaI
T(CTAGA
1
0
0
XhoI
C(TCGAG
BluI,PaeR7I
AvaI,SalI
1
0
0
XmaI
C(CCGGG
SmaI
AvaI
3
0
0
表11.1.2重组DNA常用的核酸酶
核酸酶名称
主要功能
II型核酸内切限制酶
在特异性碱基序列部位切割DNA分子
DNA连接酶
将两条DNA分子或片段连接成一个DNA分子
大肠杆菌DNA聚合酶I
通过向3’-端逐一增加核苷酸,填补双链DNA分子上的单链缺口
反(逆)转录酶
以RNA分子为模板合成互补的cDNA
多核苷酸激酶
把一个磷酸分子加到多核苷酸链的5’-OH末端
末端转移酶
将同聚物尾巴加到线性双链或单链DNA分子的3’-OH末端
核酸外切酶III
从一条DNA链的3’-端移去核苷酸残基
(核酸外切酶
自双链DNA分子的5’-端移走单核苷酸,暴露出延伸的单链3’-端
碱性磷酸酶
从DNA分子的5’-端或3’-端或同时从5’-和3’-端移去末端磷酸
S1核酸酶
将RNA和单链DNA降解成5’-单核苷酸,或切割双链核苷酸单链区
Bal31核酸酶
有单链特异的核酸内切酶特性,也有双链特异的核酸外切酶活性
Tag DNA聚合酶
在高温下一单链DNA为模板按5’(3’方向合成新生互补链
无论是细菌DNA还是哺乳动物的DNA,它们在结构上都是相容的,因此从一种机体得到的DNA分子片断可以很容易地与来自另一种机体的DNA混合。这种类似性可以推广到质粒(Plasmids)。质粒是环状双股DNA分子,许多细菌中都有这种存在于染色体外的遗传物质。在重组DNA技术中,质粒在基因工程中的作用是作为载体DNA(Vector)。 图11.1.2 pBR322质粒酶切图谱
图11.1.2所示是基因工程中广泛使用的载体DNA,pBR322。该载体有4,363个碱基对,编码是从唯一的EcoRI位点开始,将GAATTC序列中的第一个T编码为1。图中显示了各种酶切位点,其中黑体字表示唯一的酶切位点,其它则有两个酶切位点。图中还显示该质粒中含有氨苄青霉素(Ap)和四环素(Tc)两种抗性标记。
基因工程微生物的构建包括如下基本步骤(图11.1.3):1)用限制性内切酶对质粒的特定位点进行切割,形成粘性末端;2)用同样的限制性内切酶对含有目标基因的外源DNA分子进行切割,两端形成与质粒上的粘性末端互补的单链;3)将切割好的质粒和基因片段混合并通过DNA连接酶键合在一起完成基因重组并重新成为环状分子;4)将重组质粒转化到微生物细胞内。
细胞经基因工程改造后能够生产两大类产物:蛋白质和非蛋白质。微生物的DNA分子与高等生物比要简单得多,特别是原核生物(如大肠杆菌),它们甚至没有细胞核,对外源的质粒有很好的相容性,同时还具有培养基简单、生长速率快等优点,因此是进行基因工程研究并应用于工业生产的首选宿主细胞。
DNA DNA
供体 工 载体
克隆
限制性酶
(1).得到所需基因,重组
基因片段 供体和载体DNA
(2).将重组DNA 传递入宿主细胞
(3).确认宿主细胞含有所需的重组DNA
(4).基因表达并生产该基因所编码的蛋白质
图11.1.3 基因工程的基本步骤:将基因从一个有机体传递到另一有机体
11.2 基因传递和重排的自然机制
在微生物细胞中有一个完善的体系防止DNA的复制错误并修复受到损伤的DNA分子。即使如此,在自然界中由于各种物理和化学因素的影响,如温度、pH、压力、离子强度、各种化学物质、光及射线等,微生物细胞的基因会发生点突变、缺失突变、插入突变及抑制突变等。这些物理和化学因素也经常用于传统的诱变育种
生态系统中共存的各种微生物之间会发生基因从一个有机体向另一个转移,使微生物获得外源基因,第五章介绍的转化(Transformation)、转导(Transduction)和接合作用(Conjugation)等就能实现自然的基因重组。
另一种与上述现象密切相关而且具有重要意义的现象是细胞内基因的重排,称为易位子(Transposon)。易位子是一个或几个基因,具有从某一DNA分子 “跳跃”到另一个DNA分子、或在同一DNA分子内跳跃到另一位置的能力。易位子将其本身整合到新位置的能力与受体DNA的同源性无关,其功能也不是为了编码蛋白质。当一个基因的两端与插入基因片段联接时经常会出现易位子。许多易位子具有编码抗生素抗性的能力。
易位子的重要功能是:1)当易位子装入一个基因中间时会诱导基因突变;2)易位子能够将两个本来分开的基因带到一起;3)与质粒或者病毒引起的基因传递过程相结合,易位子能够传递无关细菌之间基因的移动(例如,多抗生素抗性基因在新构建质粒中的移动)。易位子突变是改变细胞性质非常有用的工具。
上述基因传递方法虽然在自然界发生的频率不高,但是提供了将基因从一个细胞传递到另一个细胞的基本方法,也为进一步改善并发展新的基因传递过程创造了条件,是重组DNA技术的重要基础。
11.3 基因工程的基本要素
基因工程是一些工具或要素的综合,至今基因工程仍没有一个非常精确的定义。一般认为,基因工程是通过细胞外操纵DNA分子,根据预先设计的控制因素,创造出人工基因或新的基因组合。
基因工程的基本方法如图11.3.1所示,包括:分离所需要的基因、基因重组、将重组的基因转移到宿主细胞及重组基因在宿主细胞中的增殖等步骤。
11.3.1 目标基因的获得
基因工程的第一步是获得所需要的目标基因。一种最直接的方法是采用鸟枪法(Shotgun-cloning)。应用限制性酶将供体DNA 切割成许多基因片段,然后,将这些基因片段用凝胶电泳分离后任意克隆到大量的宿主细胞中,通常需要根据目标基因的某一特性建立一种高效的筛选方法用于鉴别含有目标基因的宿主细胞。显然这种方法的工作量很大而效率很低,现在已经很少采用。
杂交方法具有较好的专一性。首先需要化学合成与目标基因的一部分互补的基因探针,基因探针要比基因本身短得多,但是应该有足够的长度,这样就不会与其他DNA的序列互补。因此,在设计基因探针前,至少应该知道目标基因的部分核苷序列或该基因所编码蛋白质的部分氨基酸序列。由于基因密码具有兼并性,很难从蛋白质的氨基酸序列推演出真正的核苷酸序列,因此需要设计多种探针。同时还需要将供体DNA分解为基因片段并分离成为单股DNA,这样才能够与单链的探针反应。
细菌作为宿主细胞具有生长速度快、培养简单而且成本低廉的优点,因此细菌是基因工程首选的宿主细胞。但是对于哪些具有基因内区(Intron)的真核生物基因,由于细菌细胞内没有将基因内区切割下来的功能,也不能进行mRNA的拼接,因此具有基因内区的真核生物基因不能直接放到细菌中,即使转移进去了也不能表达所需要的蛋白质。为此可以从基因供体微生物的细胞质中用杂交探针方法将对应于所需基因的mRNA分离出来,然后就可以应用逆转录酶(Reverse transcriptase)合成具有对应核苷序列的DNA分子,这种DNA分子称为互补(Complementary)DNA或cDNA。
随着DNA合成技术的发展,目标基因也可以根据所需蛋白质的氨基酸序列完全用化学方法合成, 即使人工合成基因的核苷酸序列与天然基因不完全一致,但是它们编码得到的蛋白质却是完全一样的。全化学合成基因的一个重要应用领域是蛋白质工程,用于对天然蛋白质的结构进行改性和修饰,也可以用于生产完全人工设计的蛋白质。应用蛋白质工程生产的蛋白质将具有天然蛋白质所没有的性质,如良好的稳定性、更好的专一性和催化效率及新的催化能力等。
11.3.2 载体DNA
分离得到了目标基因后,基因重组的第二步就是把目标基因装配到载体DNA,质粒就是一种典型的载体。载体的定义是: 在细胞群体中为目标基因片段提供增殖场所的DNA分子。载体应该具有以下性质:
在宿主细胞中具有自我复制的能力;
能够与各种分子量的外来DNA片段结合而又不会影响本身的复制能力;
载体DNA经过细胞外重组后仍然能够顺利进入宿主细胞;
载体DNA应该含有至少一个选择性标记,这样可以迅速而又可靠地筛选出含有载体DNA的细胞;
对于一种或几种限制性内切酶,载体DNA上只有一个目标切点。
表11.3.1 常用的质粒及其性质
质粒名称
分子量(106dal)
拷贝数染色体
自我转移能力
表型特征
Col质粒
ColE1
4.2
10-18
不能
大肠杆菌EI(膜的变化)
Col E2
5.0
10-18
不能
大肠杆菌EII(Dnase)
ColE3
5.0
10-18
不能
大肠杆菌EIII(核糖体RNase)
性质粒
F
62
1-2
能
F性须(F pilus)
F’lac
95
1-2
能
F性须,Lac操纵子
R质粒
R100
70
1-2
能
Cmlr,Strr,Sulr,Tetr
R64
78
少数
能
Tetr, Strr
R6K
25
12
能
Ampr, Strr
PSC101
5.8
1-2
不能
Tetr
重组体质粒
pDM500
9.8
约20
不能
黑腹果蝇组蛋白基因
pBR322
2.9
约20
不能
高拷贝数
pBR345
0.7
约20
不能
ColE1改型
除质粒外,噬菌体(、噬菌体M13及粘粒(Cosmids或称为装配型质粒)也能用于E.coli的基因重组。噬菌粒载体是有M13噬菌体和质粒结合而成的新型载体,它克服了M13噬菌体克隆外源DNA的能力十分有限(小于1,500bp)的缺点,而且分子量小,易于体外操作。一些基因工程常用的质粒和噬菌体列于表11.3.1和表11.3.2。下面将以重组E. coli为例介绍质粒的结构。
质粒的分子量以小一些为宜。小分子量的质粒有利于操作,克隆了外源DNA片段(一般不会超过15kb)后仍可有效地转化到宿主细胞。小分子量的质粒一般具有较高的拷贝数,而且降低了限制性内切酶具有多重识别位点的机率。
质粒可以通过转化进入E. coli,一个被转化的E. coli细胞只能接受一个质粒,而我们需要的是含有大量相同质粒的细胞,这样就能利用大量的目标基因合成蛋白质。因此质粒必须能够在生长中的E. coli细胞中增殖。为此在质粒的设计中必须插入一个含有大约600bp长度的核苷酸片段的复制源区或称为复制起点(Origin of replication),该源区的作用是控制细胞内质粒的复制和调节质粒的拷贝数,使胞内的质粒拷贝数保持在适当的水平。对于E. coli而言,拷贝数在25-250的范围内比较适当。在某些情况下,会产生温度敏感的突变株,当温度改变时会引起质粒的过量复制,使质粒拷贝数不断增加直至细胞死亡。
表11.3.1 常用的噬菌体及其性质
噬菌体(
载体名称
载体类型
克隆位点
克隆能力(kb)
重组体的识别
(BV2
插入型载体
BamHI
0-10.1
No
(NM641
插入型载体
EcoRI
0- 9.7
清亮噬菌斑
Cheron 4
替换型载体
EcoRI
7.9-18.8
Lac-,Bio-
(EMBL 3
替换型载体
BamHI
10.4-20.1
Spi-
(gtWES.T5-622
替换型载体
EcoRI
2.4-13.3
对ColIb不敏感
(1059
替换型载体
BamHI
8.0-21.0
Spi-
粘粒载体
载体名称
复制子
分子量(kb)
选择记号
克隆位点
克隆能力(kb)
c2XB
pMBI
6.8
Ampr,Kanr
BamHI,ClaI,EcoRI,HindIII,
PstI,SmaI
32-45
pHC79
pMBI
6.4
Ampr,Tetr
BamHI,ClaI,EcoRI,HindIII,
PstI,SmaI
29-46
pHS262
ColE1
2.8
Kanr
BamHI,EcoRI,HindII
34-50
pJC74
ColE1
15.8
Ampr
BamHI,EcoRI,BglII,SalI
21-37
pJB8
ColE1
5.4
Ampr
BamHI,HindIII,SalI
31-47
MuA-10
pMBI
4.8
Tetr
EcoRI,BalI,PvuI,PvuII
32-48
噬菌粒载体
噬菌粒
质粒
单链噬菌体
辅助噬菌体
大肠杆菌寄主菌株
pMBL8
pUC8
f1
IR1
71/18
pRSA101
(VX
M13
M13变异株
XS127,XS101
pUC118/pUC119
pUC18/pUC19
M13
M13K07
MV1184
pBS
pUC
f1
M13K07
XL-1-Blue
Lac-:不能合成半乳糖苷酶;Bio-:不能合成生物素;Spi-:对P2噬菌粒的抑制作用呈抗性.
Ampr:氨苄青霉素抗性;Kanr:卡那霉素抗性Tetr:四环素抗性.
质粒中必须含有选择性标记。最常用的是含有抗生素抗性标记,这样只要将基因工程细胞放到含有一定浓度抗生素的培养基中培养,就只有含质粒细胞才能生长,而无质粒的细胞将被抗生素杀死。这种方法既能正确、快捷地筛选出含质粒细胞,加速实验室研究的进程,又能够在基因工程菌的大规模培养中使用。只要在培养基中加入一定浓度的抗生素就能够始终保持只有含质粒细胞才能生长。选择性标记的另一种方法是筛选出营养缺陷型的宿主细胞,使宿主细胞只能在添加了该细胞生长所必需的某种物质的培养基中才能生长,而在重组的质粒中则包含产生该酶的基因,使得质粒所表达的酶能够弥补营养缺陷型宿主细胞不能合成该种酶的缺陷,因此含质粒细胞可以在不加该酶的培养基中生长,无质粒细胞则不能。
如果基因工程菌的目标产品是蛋白质,蛋白质的产量与质粒的拷贝数有关,但是两者并不一定严格成正比关系,例如,当质粒的拷贝数从25增加到50时,蛋白质产量可能会增加一倍,如拷贝数进一步增加到100,蛋白质的增加量就不到一倍了。有些质粒属于低拷贝数质粒,因为在细胞分裂前质粒DNA只能复制1-2次,每个细胞中就只有几个质粒。有些是松弛型质粒,质粒DNA可以重复复制只止达到适当的拷贝数,细胞内的质粒数可以达到10-100个。松弛型质粒更适宜于作为载体DNA。
穿梭质粒载体(Shuttle plasmid vector)是指一类由人工构建的具有两种不同复制起点和选择标记,因而可以在两种不同宿主细胞中存活和复制的质粒载体。穿梭质粒载体能够携带着外源DNA序列在不同物种的细胞之间,特别是在原核和真核细胞之间往返穿梭,因此在基因工程的研究工作中十分有用。常见的穿梭质粒载体有用于大肠杆菌-枯草芽孢杆菌穿梭质粒载体(如pHV14和pEB10)、用于大肠杆菌-酵母穿梭质粒载体(由大肠杆菌的质粒与酵母的Yip, Yrp,Ycp的Yep质粒构成)和大肠杆菌-动物细胞穿梭质粒载体等。利用穿梭质粒载体,能够方便地在大肠杆菌中进行重组DNA操作和增殖,然后再返回到其它宿主细胞中进行表达。
要使质粒中的目标基因开始转录,质粒中必须装配适当的启动子(Promotor)。启动子受到诱导时,目标基因开始转录,并开始合成蛋白质,因此启动子对蛋白质的合成具有很大的影响。用于大肠杆菌的部分启动子列于表11.3.3。
表11.3.3用于E. coli 的强启动子
启动子名称
诱导方法
特征
LacUV5
添加IPTG
(约5%)
Tac
同上
诱导引起细胞死亡 (>30%)
Ipp-OmpA
同上
用于释放型蛋白质 (20%)
Ippp-5
同上
最强的启动子 (47%)
Trp
色氨酸饥饿
比较弱 (约10%)
(pL
在42(C生长
(>30%)
(pL/cltrp
加色氨酸
容易诱导,适合大生产 (24%)
Att-nutL-p-att-N
在42(C培养10分钟
诱导前无产物生成(on/off启动子)
T7启动子
加IPTG或病毒感染
同上 (>35%)
T4启动子
病毒感染
诱导抑制产物降解的方法
PhoA
磷酸盐饥饿
不适合于大规模生产时诱导
注:挂号内数字是被诱导细胞内结累的产物占细胞总蛋白质的百分数
一个理想的启动子应该是受到很好调节的强启动子。同时,宿主细胞的基底蛋白质生产水平应该是零,如果这种蛋白质对宿主细胞有毒时尤其重要。另外启动子对诱导剂的响应应该迅速、诱导剂价格低、使用安全。诱导方法不但能够在试验室小试中应用,还应考虑在工业规模的可行性。例如温度诱导在小规模时较容易实现,但是在大发酵罐中要改变温度会产生严重的滞后, 会对细胞产生热冲击响应及增加蛋白水解酶的活力。另外许多化学诱导剂价格昂贵, 而且如果残留在产品中会造成健康问题。某些启动子需要营养缺陷进行诱导,因此存在着怎样精确地控制诱导的问题。
与质粒中的启动子相对应的是目标基因转录的终止子(Terminator)。如果采用强启动子,就必需有强终止子与之匹配。终止子的作用是:在目标基因被转录后当读到特定的操纵子时会释放出RNA聚合酶以结束转录。如果终止子不够强,RNA聚合酶得不到及时释放,不但会造成不需要基因的转录,而且会干扰控制质粒拷贝数的基因单元,严重时还会发生质粒复制失控和细胞死亡。
有些宿主细胞,如枯草杆菌,能够合成蛋白酶,因此目标蛋白质合成后会受到蛋白酶的攻击而水解。为了防止这种现象,在质粒的设计时可以采用两种方法: 一是设计一个杂交基因用于合成不易受到蛋白酶攻击的融合蛋白质,融合蛋白质分子中的主要部分是目标蛋白质,另一小部分是宿主细胞本身能够合成的某种蛋白质,它们之间的连接键在下游过程中应该能被很容易地断开,而且两种蛋白质的分离也不应成为问题;第二种方法是在质粒中加入一段信号肽基因,这样产生的蛋白质上将有一段信号肽,可以使蛋白质释放到周质体或胞外以避免胞内蛋白酶的攻击,信号肽本身则会在通过细胞壁时与目标蛋白质断开。但是信号肽与蛋白质的结合并不能保证蛋白质释放到胞外,有时根本不释放,有时则可能会释放到周质体中。目前还没有建立起信号肽选择及保证蛋白质释放的一般方法。
宿主细胞在分裂时,质粒在子代细胞中的分布是任意的,有些子代细胞中可能不含质粒。这种现象如图11.3.2所示,称为分离不稳定性(Segragational instability)。为了防止不含质粒细胞的产生,在构建质粒时可以考虑加入称为par和cer的位点。它们的作用是使子代细胞中质粒的分布更均匀。Par的功能可能与促进质粒与膜之间形成复合体有关,而cer则能够防止多聚体质粒的形成。
正常
不正常
图11.3.2 基因工程细胞的分裂不稳定性
总之,质粒的构建是一个非常复杂而细致的工作,质粒构建的好坏对基因工程菌的培养及产物的积累都具有重要的影响,并能进一步影响到基因工程产物的分离和提纯。质粒的构建一方面需要有分子生物学的理论指导,另一方面也需要有丰富的研究工作经验。
11.3.3 基因重组
载体DNA都有详细的DNA图谱,显示了限制性酶切位点,典型的有从E. coli得到的EcoR 1酶切点和从Bacillus amylofacieus得到的Bam H1酶切点。这样就可以用限制性酶根据需要进行质粒的切割。限制性酶在切割载体时往往会留下一个由几个核苷酸组成的单股DNA粘合端(Sticky ends),它能与具有互补粘合端的DNA会发生缔合。这样,将切割后的载体和供体DNA混合,就能够使载体DNA与供体DNA发生缔合,再在DNA连接酶的作用下就可以将接口永久地结合在一起,这样就完成了DNA的重组过程。图11.3.3说明了这一过程。
11.3.4 质粒的转化
经DNA重组得到的含有目标基因的质粒必须放到一个宿主细胞中,这个过程通常由基因转化的方法实现,只有当转化方法的实现有困难时才会考虑其它方法。当选择大肠杆菌为宿主细胞时,典型的质粒转化包括以下步骤(图11.3.3):
预先培养大肠杆菌,离心收集培养好的细胞;
将收集的大肠杆菌重新悬浮到经过预冷的0.1mol/L CaCl2溶液(40C)中获得感受态细胞;
在上述细胞悬浮液中加入重组质粒,保持40C放置约30分钟;
将温度提高到约400C,保持1-5分钟;
再次将温度降低到40C,保持约5分钟。
经过以上过程后,重组质粒就能顺利地转化到大肠杆菌中。
在构建质粒时得到的往往是混合物,如:某些载体虽然被打开但未与供体DNA结合就自行闭合,有些载体中可能放入了多拷贝的供体DNA,也可能在某些载体中装入了载体DNA混合物中的DNA污染物,因此需要建立起有效的筛选方法筛选出具有正确载体-供体组合的转化细胞。一般而言,在大多数载体DNA的设计中都考虑了选择性标记,如抗生素抗性或营养缺陷型标记等,这样,只要细胞能够在含抗生素平板或基本培养基平板上生长,就证明它含有所需要的质粒。进一步的筛选工作是需要确认供体DNA片段的存在并能够成功地表达其所代表的功能蛋白质,常用的筛选方法有同位素标记和荧光标记等。
图11.3.3 基因重组步骤示意图
在基因克隆时一个很重要的问题是基因数目的扩增以便于基因的测序和分析、基因图谱的编制、致病机体的基因诊断、生物进化研究等,为此一种称之为聚合酶链式反应(Polymerase chain reaction, 简称PCR)的技术得到了迅速的发展。PCR扩增技术的基本要求是待扩增基因两端各有一段引物的核苷酸序列(一般小于20个核苷酸)应该已知。扩增的方法是将含基因的溶液加热引起双股DNA的两条互补链分离,然后加入经化学合成并与目标基因上的引物互补的片段使之与目标基因的引物键合,随和加入耐高温的DNA聚合酶(Taq polymerase)和四种脱氧核苷酸,就会以单股DNA链为模板迅速地合成与之互补的链,这样一个循环下来原基因就有了两个拷贝,两个循环后成为四个拷贝等。依此类推,一台PCR扩增仪一天至少能做30个循环,产生230个基因拷贝。PCR扩增已经成了基因工程不可缺少的研究工具。
11.4宿主细胞的选择原则
基因工程的成功与否常常取决于最初对宿主细胞和表达系统的选择。表11.4.1总结并比较了各种宿主细胞的优缺点。在选择宿主细胞时,最重要的考虑因素是目标产物是否需要翻译后的修饰及修饰的程度。如果需要广泛、复杂的翻译后修饰,应该首选动物细胞作为宿主系统;若只要简单的翻译后修饰,酵母或霉菌就能够满足要求。第二个需要考虑的因素是产物的用途。例如,若产物将用于食品工业,则采用酵母作为宿主细胞是最安全的。选择宿主细胞需要考虑的其它问题还有:培养成本、产物是否释放到胞外及对产物分离的影响等。下面将就几类典型微生物作为宿主细胞的特点进行讨论。
11.4.1大肠杆菌(Escherichia coli)
如果目标产物不需要翻译后修饰,E. coli是首选的宿主细胞系统。其最重要的理由是:人们已经建立起了关于E. coli的较为完整的知识基础,掌握了E. coli的生理和遗传方面的规律,发展了各种各样的载体系统和启动子,有了一套成熟的基因重组技术,因此可以大大加快基因工程的研究开发速度。另外,E. coli的生长速度快、可以做到高密度细胞培养(>50g/l)、高表达水平(目标蛋白质占总蛋白质的比例可以达到25-50%,甚至更高)、培养介质简单而且价格低廉等因素都促使E. coli成了基因工程中应用最广泛的宿主细胞。
作为宿主细胞, E. coli的主要缺点是蛋白质不能糖基化及质粒表达的蛋白质通常不能释放到胞外。由于蛋白质被截留在胞内,而且表达水平很高,可溶的、具有生物活性的蛋白质比例就很少。在胞内结累大量的外源蛋白质还可能诱发热震扰,激活热震扰调节子后会增加胞内蛋白酶的活性。这样合成的蛋白质会受到蛋白酶的攻击,严重时会出现蛋白质的合成速率几乎等于被酶分解的速率。
表11.4.1 各种宿主细胞用于重组DNA生产蛋白质的主要特点
特征
细胞
E. coli
B.subtilis
S.cerevisiae
霉菌
昆虫*
动物
高生长速率
E
E
VG
G-VG
P-F
P-F
基因系统的可用性
E
G
G
F
F
F
表达水平
E
VG
VG
VG
G-E
P-G
是否可用廉价培养基
E
E
E
E
P
P
蛋白质折叠
F
F
F-G
F-G
VG-E
E
简单的糖基化
No
No
Yes
Yes
Yes
Yes
复杂的糖基化
No
No
No
No
Yes
Yes
低水平蛋白酶活
F-G
P
G
G
VG
VG
产物释放胞外的能力
P/VG
E
VG
E
VG-E
E
安全性
VG
VG
E
VG
E
F
注:E—优秀;VG—非常好;G—好;F—一般;P—差
*昆虫细胞与哺乳动物细胞进行糖基化的形式不同
基因工程大肠杆菌所表达的外源蛋白质一般会形成不溶的包含体(Inclusion body)。包含体中的主要成分是外源蛋白质,但是也含有其它细胞物质。在包含体中的蛋白质常常被错误地折叠,因此没有生物活性和使用价值。需要将细胞破碎后回收包含体,再经过重新溶解和重新折叠后才能够获得具有生物活性的蛋白质产品。但是从某种意义上说, 形成包含体也是大肠杆菌作为宿主细胞的一个优点,因为包含体的分离比较方便、回收率高。不过包含体的溶解非常困难,蛋白质重新折叠的活性收率变化很大,而且产物蛋白质必须经过分析检测以保证蛋白质具有正确的结构和生物活性。
在E. coli细胞质中生成的蛋白质还有一些值得重视的问题。例如: 在E. coli的胞内环境中形成的蛋白质可能不会形成二硫键;基因工程细胞产生的蛋白质的起始氨基酸通常是蛋氨酸,而在自然宿主细胞产生的蛋白质在正常的翻译后加工过程中,蛋氨酸已被除去,因此基因工程蛋白质的氨基酸序列与天然蛋白质可能会有差别;细胞破碎释放出蛋白质的同时,也会使胞内的毒素释放,这些毒素一般是脂多糖类,与蛋白质的分离十分困难,留在产物中则会引起副反应甚至病人死亡。
细胞壁破碎的方法很多,可分为物理方法和化学方法两大类。最近有人将(-噬菌体的裂解基因克隆到质粒中,在培养结束时只要对裂解基因进行诱导,就能够使细胞壁裂解并使产物(聚羟基丁酸,PHB)释放。
怎样使大肠杆菌合成的蛋白质从胞内释放出来是一个值得重视、非常有意义的研究方向。蛋白质的分泌分为两类:一类是在信号肽的存在下将合成的蛋白质通过移位进入E. coli的周质体空间或与细胞的外膜结合(Secretion),信号肽本身则在释放过程中断开;另一类是将蛋白质直接释放到胞外介质中(Excretion)。
蛋白质释放到周质体空间具有很多优点:蛋白质开始处不需要的蛋氨酸可以被除去, 周质体空间的蛋白酶活力很低,因此可以起到保护蛋白质的作用,在某些情况下,周质体空间还起到了帮助蛋白质进行正确折叠的作用。从周质体空间进一步释放蛋白质的条件要比细胞破碎温和得多,只要采用渗透振荡的方法就能释放产物而无须破碎整个细胞,因此胞内物质的释放很少,这对蛋白质的分离提纯十分有利。
将蛋白质直接释放到胞外是一种更具有吸引力的方法,能够简化蛋白质后加工和产物分离过程,也为实现固定化基因工程细胞连续生产蛋白质产物创造了条件。正常情况下,大肠杆菌只能将大肠菌素(colicin)和溶血素(haemolysin)两种蛋白质释放到胞外,大肠杆菌合成的其它蛋白质都不能释放。将蛋白质释放到胞外的方法主要有破坏细胞外膜和利用大肠菌素及溶血素两种蛋白质的释放系统构建目标蛋白基因的融合质粒。将目标蛋白质释放到胞外的研究已经取得了一些进展,如由Wang等人构建的基因工程大肠杆菌已经成功地将人表皮生长因子释放到了胞外, 并实现了高表达。
大肠杆菌作为宿主细胞的另一个问题是在工程菌的培养过程中会积累醋酸, 而醋酸对大肠杆菌的生长和蛋白质的合成有严重的抑制作用, 因此应该设法消除醋酸的抑制。培养方法的改进及采用发酵和醋酸分离耦合方法将醋酸及时地进行分离具有一定的效果,能够增加细胞密度、提高蛋白质的表达量。
Gram-阳性细菌
研究得最多的Gram-阳性细菌是枯草杆菌(Bacillus subtilis)。Gram-阳性细菌作为基因工程宿主细胞的主要优点是没有细胞外膜,因此可以有效地将蛋白质释放到胞外。许多具有工业重要性的蛋白质,如淀粉酶、蛋白酶等就是由枯草杆菌生产的。如果外源蛋白质也能被枯草杆菌表达并释放到胞外,就能成为很有吸引力的基因工程蛋白质生产系统。
遗憾的是枯草杆菌生产的各种胞外蛋白酶太多,它们会将目标蛋白质迅速降解。即使有些突变株产蛋白酶很少,它产生的少量蛋白酶也足以影响目标蛋白质的产量。另外, 枯草杆菌的基因操纵比较困难,能够利用的载体和启动子不是很多,质粒的遗传稳定性也比用于大肠杆菌的质粒差。此外,重组枯草杆菌虽然具有将蛋白质释放到胞外的优点,但是目前释放的水平还不高,还无法与自然枯草杆菌释放蛋白质的水平相比较。
其它研究过的Gram-阳性细菌宿主系统有链球菌(Streptococcus sp.)和放线菌(Streptomyces sp.),这些系统的特征还不是非常清楚,有待于进一步深入探索。
11.4.2低等真核生物细胞
啤酒酵母(Saccharomyces cerevisiae)是人类最早用于食品和发酵工业的微生物之一,因此使用的安全性非常好。啤酒酵母的生长速率比较快,而且能够达到的细胞密度很高,它的细胞体积比大肠杆菌大得多,有利于从培养介质中将酵母分离出来。当啤酒酵母用于基因工程的宿主细胞时,能够对产物蛋白质进行简单的糖基化,而且能释放到胞外。
啤酒酵母作为宿主细胞的主要缺点是蛋白质的表达水平比大肠杆菌低得多,细胞中蛋白质的释放途径有限,尤其是在表达水平较高时,蛋白质的释放将成为系统的瓶颈。
其它可以用于宿主细胞的酵母细胞有:克鲁维酵母(Kluyveromyces lactis), 雅鲁瓦酵母(Yarrowia lipolytica),毕赤酵母( Pichia pastoris)等。它们和啤酒酵母有类似的性质和特点。
霉菌,如Aspergillus nidulans 、Trichoderma reesei等也都能用于基因工程宿主细胞,霉菌释放蛋白质的能力比啤酒酵母好,但是表达和释放系统的构建则比较困难,目前还没有很好的质粒能用于霉菌大量表达外源蛋白质,霉菌产生的蛋白酶也会造成目标蛋白质的降解。
如果蛋白质产物需要经过复杂的糖基化,无论是原核生物还是低等真核生物细胞都不适合作为宿主细胞,这样就需要发展动物细胞作为宿主细胞的表达系统。关于动物细胞作为宿主细胞超出了本书的范围,有兴趣的读者可以参考有关专著。
11.5 目标产物对基因重组技术的影响
基因工程细胞一般用于两类产物的生产:蛋白质和非蛋白质。非蛋白质类产物的生产可以通过代谢工程(metabolic engineering)实现,即在细胞中克隆DNA编码的酶使之形成新的代谢途径或者在现有的代谢途径中强化代谢产物的某些前体的生产能力。代谢工程已经成功地应用于氨基酸、抗生素等生产菌的选育及环境保护领域。
至于蛋白质类产物,主要用途是医药,但在食品加工、酶制剂及动物饲养等领域也有良好的应用前景。一些通过基因工程细胞培养获得的蛋白质产品列于表11.5.1。
目标产物的性质和用途对宿主细胞的选择具有重要影响。对于注射用药品,需要考虑的主要问题是产物的治疗效果,蛋白质是否正确地翻译及翻译后修饰加工(如糖基化或磷酸化)对蛋白质的生物活性至关重要,因此就应该首先考虑选择能够正确进行蛋白质修饰加工的宿主细胞,如哺乳动物细胞。杂质的存在将引起病人的免疫反应和副反应,因而在选择宿主细胞时就需要考虑目标产物能否释放到胞外及培养基成分对产物分离的影响。由于医药产物通常具有很高的价值而且产量较小, 培养基成本及过程效率等因素的影响就要小一些。
应用于动物疫苗和动物生长激素类的基因工程产物,例如能够提高牛奶产量的牛生长激素,对产物纯度要求也相当高,但是生产成本又不能太高,因此就应该选择既能正确地进行翻译及修饰加工,培养成本又比较低廉的细胞体系。应用于食品工业的基因工程产物的纯度要求可以低一些,但是对使用的安全性则有较高的要求,在选择宿主细胞时应该考虑宿主细胞本身和它的代谢产物对人类无害,当然培养成本对产物价格的影响也是一个非常重要的因素。
基于代谢工程的非蛋白质类产物, 是否采用基因工程菌生产主要取决于与传统方法生产的成本比较。
表11.5.1基因工程细胞培养得到的部分蛋白质产物
产物名称
用途
英文名称
中文名称
A、Hormone and peptide factors(激素和多肽类产物)
Human insulin
人胰岛素
糖尿病
Factor VIII-C
因子VIII-C
血友病
Human growth Hormone
人生长激素
生长缺陷
Bovine growth hormone
牛生长激素
增加牛奶和牛肉的产量
Porcine growth hormone
猪生长激素
增加猪肉的产量
Erythropoietin
促红细胞生成素
贫血、慢性肾病
Human epidermal growth factor
人表皮生长因子
创伤愈合,化妆品
Atrial peptide
心房肽
急性阻塞型心脏病
T-cell modulatory peptide
T-细胞调节肽
自身免疫性疾病
Interferon-alpha 2a
干扰素-( 2a
毛细胞白血病
Interferon-alpha 2b
干扰素-( 2 b
慢性骨髓性白血病
Interferon-alpha
干扰素-(
疱疹,AIDS
Interferon-beta
干扰素-(
癌症,细菌感染
Interferon-gamma
干扰素-(
癌症,性病,传染病
Interleukin-2
白细胞介素-2
癌症免疫疗法
Colony stimulating factor
群落刺激因子
化疗,AIDS
Tumor necrosis factor
肿瘤坏死因子
癌症
B. Enzyme(酶)
Tissue plasminogen activator
组织血纤维蛋白溶酶原活化因子
急性心肌炎
Urokinase
尿激酶
心脏病
Superoxide dismutase
超氧化物歧化酶
重灌注损伤,肾移植
Prochymosin
凝乳酶原
制造奶酪
C. Vaccines(病毒)
Hepatitis B
B型肝炎病毒
B型肝炎
AIDS
AIDS病毒
DIDS病
Foot and mouth disease
口蹄疫病毒
牛口蹄疫
Diphtheria toxin
白喉病毒
白喉
Maralia Vaccines
疟疾病毒
疟疾
D. Monoclonal antibodies(单克隆抗体)
For diagnostics
用于诊断
For kidney transplant rejection
用于肾移植排斥
For septic shock
用于败血症
For bone marrow rejection
用于骨髓移植排斥
For colorectal cancer
用于结肠癌
For heart transplant rejection
用于心脏移植排斥
For liver transplant rejection
用于肝脏移植排斥
For lung and ovrian cancer
用于肺癌和卵巢癌
11.6质粒稳定性及影响质粒稳定性的因素
除了前面已经讨论过的由于细胞分裂引起的质粒分布不均匀问题外,其它因素也会造成宿主细胞丢失外源质粒。主要原因是大量合成的外源蛋白质总是会对宿主细胞的生长产生危害,含质粒细胞的生长速度总是要比不含质粒细胞的生长速度低,而且所含的质粒越多,生长速度越慢。
质粒也会形成多倍体。宿主细胞的重组系统会使几个原来分离的质粒聚合,形成二倍体、四倍体等。虽然多倍体也能够复制,但是多倍体的形成减少了细胞内质粒的数目,提高了细胞分裂时产生不含质粒子细胞的概率。从下面的例子中可以清楚地看到形成多倍体对细胞分裂时生成不含质粒子细胞的影响。
例10. 1 细胞分裂引起的质粒分布不均匀问题
如果:(1) 每个细胞在分裂时都有40个质粒; (2) 虽然每个细胞都有40个质粒, 但是其中的一半形成了二倍体, 五分之一形成了四倍体; (3) 一半细胞的质粒拷贝数是10个, 而另一半是70个(平均也是每个细胞40个质粒)。
求: 这三种情形下细胞每次分裂产生不含质粒细胞的概率。
解: (1) 假设细胞分裂后子代细胞中质粒的分布是任意的, 则生成无质粒细胞的概率可以用下式计算:
P = 2(1 – Z) (10. 1)
式中, Z是细胞中的质粒数。若Z = 40, 则P = 1.8(10-12。
(2) 令M, D, T分别代表质粒单体, 二倍体和四倍体的数量, 则
M + 2( D + 4(T = 40
D = 40/(2(2) = 10
T = 40/(5(4) = 2
M = 40 - 2(10 - 4(2 = 12
因此, 细胞内真正能够分配到子代细胞的等价质粒数只有:
M + D + T = 24
这样, 产生无质粒细胞的概率是:
P = 2(1 - 24) = 1.2(10-7
可见, 多倍体的形成大大增加了子代细胞中形成无质粒细胞的概率。
(3) 当质粒在细胞中的分布不均匀时, 应该分别计算每一种质粒数细胞分裂产生无质粒细胞的概率, 然后相加。
P = 0.5(P10 + 0.5(P70 = 0.5(2(1 – 10) + 0.5(10(1 – 70) = 9.8(10 -4+ 8.5(10 –22
= 9.8(10 -4
可见, 含质粒较少的细胞分裂形成无质粒细胞的概率对总概率起了主要作用, 而且比质粒均匀分布时形成无质粒细胞的概率增加了5.4(10 8倍。
质粒构建时已经考虑了抗性标记,如抗生素抗性标记,因此只要在培养基中加入抗生素,不含质粒的细胞就不能生长。但是由于含质粒细胞大量利用宿主细胞的资源合成外源蛋白质,而对宿主细胞本身无任何好处,这样有可能导致质粒DNA发生突变,使得质粒虽然保留了抗生素抗性的特点,但是丧失了合成目标蛋白质的能力。另一种可能性是细胞内的重组系统将抗生素的抗性基因整合到了细胞的染色体内,这样的细胞也能在含抗生素的培养基中生长,但是不会合成目标蛋白质。无论是哪一种情况,产生突变后的细胞生长速率都将高于含正常质粒的细胞,目标蛋白质的产量将会大幅度地降低。上述现象称为质粒的结构不稳定性。
宿主细胞本身也会在培养过程中产生突变,并进而影响目标蛋白质的产量。这种突变常常使细胞的调节系统发生变化。例如,对于含乳糖启动子的质粒,正常情况下只要加入乳糖或其类似物,就能启动基因的转录和蛋白质合成。但是如果宿主细胞发生了突变,使得乳糖透膜酶失活,这样诱导物就无法透过细胞壁,启动子就不能启动结构基因转录,目标蛋白质也就不会合成。宿主细胞的突变也可能发生在阻遏子,使阻遏子不能识别诱导物,这样启动子同样不能被启动。这种情况属于宿主细胞本身的遗传不稳定性,其特点是质粒本身并没有发生变化,只是由于宿主细胞的突变使目标蛋白质的合成不能进行。由于细胞内不积累蛋白质,这种细胞的生长速率也将加快。
无论是什么原因引起的质粒不稳定性,最终结果都是使不含质粒的细胞具有生长优势,在长期的培养过程中将导致这类细胞大量繁殖,目标蛋白质的生产能力则越来越小。要解决这样的问题,往往需要从基因工程细胞的培养条件和培养方法上想办法。例如将基因工程细胞的培养分成两个阶段:第一阶段不加诱导剂,这样目标蛋白质不会合成,使细胞具有较高的生长速率,在第一阶段结束时达到较高的细胞密度和相应的质粒数,由于第一步中目标基因不会表达,还可以避免目标蛋白质被胞内蛋白酶降解;第二阶段,当达到高细胞密度后再加入诱导剂,就会在短时间内使蛋白质大量表达。两个阶段的培养条件可以分别予以优化,最终可以达到高细胞密度、高表达。
11.7代谢工程
基因工程能够赋予细胞新的代谢途径或者增强已经存在的代谢途径。基因工程在这些领域的应用称为代谢工程。推动代谢工程发展的动力是在生产特殊化学品(如生物素、氨基酸及靛蓝等)、利用可替代的底物(如用木糖代替葡萄糖作为碳源)及降解有毒的废弃物(如三氯乙烯及联苯等)等领域对微生物提出的新要求。
与传统的诱变育种相比,应用代谢工程的方法改造微生物具有下述优点:
能够将受到调节启动子控制的特殊代谢途径加到微生物中,使得在正常情形下受到阻遏的代谢途径能够在一定的条件下启动。这一点对于有毒废物的降解十分重要。
在天然微生物中所需代谢途径中某种关键酶的活力很低,而经过代谢工程改造的细胞中,通过增加编码该酶的基因,能大大提高该酶的活力,这样就能使目标产物的产量增加。
低等真核生物中的一条代谢途径移到细菌中后,只需要一个启动子,而在低等真核生物中每一种蛋白质的转录都需要一个单独的启动子。
从几种微生物中获得的若干条代谢途径能够转化到同一个宿主细胞中表达,这样该细胞就获得了多种新的功能。
可以将某种生长缓慢的微生物中的代谢途径克隆到容易生长的细胞中,这样就提高了生产效率。
可以改善细胞的某些性质,提高目标产物的产量。
与其它基因工程细胞类似,经过代谢工程改造的细胞也存在一些问题,其中最重要的是质粒稳定性和管理制度的限制。以价格昂贵的蛋白质生产为目标的基因工程细胞一般采用间歇培养,可以通过在培养周期即将结束时诱导蛋白质的合成减少质粒不稳定性的影响,而且生产周期短,不含质粒细胞的影响相对较小,也没有必要考虑细胞的重复利用。但是,经过代谢工程改造的细胞所生产的目标产物一般价值比较低,在用于有毒物质降解时完全没有经济效益,因此最好能够实现细胞的重复利用或延长使用期,显然这对于基因工程细胞的培养是很难做到的。如果基因重组时用了抗生素标记,可能产生对代谢工程细胞产品的污染,在有些应用领域则显得不够经济。在代谢工程细胞中蛋白质超额生产的水平一般不是很高,但是仍会使细胞经受高水平的代谢负担,影响细胞的生长和代谢。此外,如果代谢工程细胞用于处理有毒化合物,就面临着与自然筛选细胞的竞争问题。
管理制度的限制对代谢工程细胞的应用也带来了困难。许多国家规定不允许将基因工程细胞排放到环境中去,但是如果代谢工程细胞的应用对象是处理有毒化合物,对基因工程微生物的控制将会十分困难甚至不可能。在这种应用领域,就必须慎重考虑含基因工程微生物废水的安全排放问题。