生物工程专业核心课程
基 因 工 程
华东理工大学 张惠展
基因工程
5
2
3
4
1
6
7
8
9
基因工程的基本概念
基因工程的基本原理
基因工程所需的基本条件
基因工程的操作过程
目的基因的克隆与基因文库的构建
大肠杆菌基因工程
酵母基因工程
哺乳动物基因工程
高等植物基因工程
D 基因工程菌的遗传不稳定性及其对策
6 大肠杆菌基因工程
C 大肠杆菌基因工程菌的构建策略
B 外源基因在大肠杆菌中高效表达的原理
A 大肠杆菌作为表达外源基因受体菌的特征
E 利用重组大肠杆菌生产人胰岛素
A 大肠杆菌作为表达外源基因受体菌的特征
6 大肠杆菌基因工程
大肠杆菌表达外源基因的优势
全基因组测序,共有 4405个开放型阅读框架
基因克隆表达系统成熟完善
繁殖迅速、培养简单、操作方便、遗传稳定
被美国 FDA批准为安全的基因工程受体生物
A 大肠杆菌作为表达外源基因受体菌的特征
6 大肠杆菌基因工程
大肠杆菌表达外源基因的劣势
缺乏对真核生物蛋白质的复性功能
缺乏对真核生物蛋白质的修饰加工系统
内源性蛋白酶降解空间构象不正确的异源蛋白
细胞周质内含有种类繁多的内毒素
B 外源基因在大肠杆菌中高效表达的原理
6 大肠杆菌基因工程
启动子
终止子
核糖体结合位点
密码子
质粒拷贝数
启动子
启动子最佳距离的探测
目的基因
E E
A
E E
启动子
A 酶切开
Bal31酶解
目的基因
启动子
启动子的筛选
Apr
ori
galK pKO1
终止密码子 采用鸟枪法战略,将合适大小的 DNA片段
克隆到启动子探针质粒 pKO1上
受体细胞染色体 DNA上的 galE,galT与质
粒上报告基因 galk的表达产物联合作用,
可将培养基中的半乳糖酵解成红色素物质
转化 galE+,galT+,galK-的大肠杆菌受体菌株
含有外源启动子活性的重组克隆
启动子
启动子的构建
-35 区序列 -10 区序列
PlL
PrecA
Ptrp
Plac
PtraA
Ptac
启动子
T T G A C A G A T A C T
T T G A T A T A T A A T
T T G A C A T T A A C T
T A G A C A T A A T G T
T T T A C A T A T A A T
T T G A C A T A T A A T
Ptac = 3 Ptrp = 11 Plac
启动子
启动子的可控性
P
乳糖启动子 Plac的可控性,
O
P O
高效转录
阻遏蛋白
诱导
乳糖 异丙基 -b-D-硫
代半乳糖苷( IPTG)
野生型的 Plac与其控制区 Olac
偶联在一起,在没有诱导物
存在时,整个操纵子处于基
基底水平转录
底水平表达;诱导物可以使
启动子 Plac介导的转录大幅
提高
启动子
启动子的可控性
Plac
乳糖启动子 Plac的可控性,
O
Plac O
高效转录
葡萄糖代谢
野生型的 Plac上游附近拥有
代谢激活因子( CAP) 结合
区,cAMP激活 CAP,CAP
基底水平转录
结合启动子控制区,进而促
进 Plac介导的转录。葡萄糖
代谢使 cAMP减少,也能阻
遏 Plac介导的转录。因此,
基因工程中使用的乳糖启动
子均为抗葡萄糖代谢阻遏的
突变型,即 Plac UV5
CAP
cAMP
cAMP浓度降低
Plac UV5 O
高效转录
启动子
启动子的可控性
Ptrp
色氨酸启动子 Ptrp的可控性,
Otrp
除去 色氨酸
色氨酸启动子 Ptrp受色氨酸 -阻遏
蛋白复合物的阻遏,转录呈基底
状态。在培养系统中去除色氨酸
基底水平转录
或者加入 3-吲哚丙烯酸 ( IAA),
便可有效地解除阻遏抑制作用。
在正常的细菌培养体系中,除去
色氨酸是困难的,因此基因工程
中往往添加 IAA诱导 Ptrp介导的目
基因的表达
色氨酸
或加 3-吲哚丙烯酸
高效转录
阻遏蛋白
( IAA)
Otrp Ptrp
高效转录
Otrp Ptrp
启动子
启动子的可控性
l噬菌体 启动子 PlL的可控性,
噬菌体启动子 PL受 CI阻遏蛋白阻
遏,很难直接诱导控制。在基因
工程中常使用温度敏感型的 cI突
变基因 cI857控制 PL。 cI857阻遏蛋
在 42℃ 时失活脱落,PL便可介导
目的基因的表达。但在大型细菌
培养罐中迅速升温非常困难,因
此常使用一个双质粒控制系统,
用色氨酸间接控制目的基因表达
Ptrp
A B
cI857
PL
目的基因
阻遏作用
Ptrp
A B
PL
表达 色氨酸
终止子
强化转录终止的必要性
外源基因在强启动子的控制下表达, 容易发生转录过头现象, 即 RNA聚合酶滑
过终止子结构继续转录质粒上邻近的 DNA序列, 形成长短不一的 mRNA混合物
过长转录物的产生在很大程度上会影响外源基因的表达, 其原因如下,
转录产物越长, RNA聚合酶转录一分子 mRNA所需的时间就相应增加, 外源基因
本身的转录效率下降;
如果外源基因下游紧接有载体上的其它重要基因或 DNA功能区域, 如选择性标
记基因和复制子结构等, 则 RNA聚合酶在此处的转录可能干扰质粒的复制及其它生
物功能, 甚至导致重组质粒的不稳定性;
过长的 mRNA往往会产生大量无用的蛋白质, 增加工程菌无谓的能量消耗;
更为严重的是, 过长的转录物往往不能形成理想的二级结构, 从而大大降低外源
基因编码产物的翻译效率
终止子
强终止子的选择与使用
目前外源基因表达质粒中常用的终
止子是来自大肠杆菌 rRNA操纵子上的
rrnT1T2以及 T7噬菌体 DNA上的 Tf。 对
于一些终止作用较弱的终止子,通常
可以采用二聚体终止子串联的特殊结
构,以增强其转录终止作用
终止子也可以象启动子那样,通过
特殊的探针质粒从细菌或噬菌体基因
组 DNA中克隆筛选
pCP1 Apr
ori
Tcr
筛选 Apr,Tcs的转化子
核糖体结合位点
外源基因在大肠杆菌细胞中的高效表达不仅取决于转录启动的
频率,而且在很大程度上还与 mRNA的翻译起始效率密切相关。大
肠杆菌细胞中结构不同的 mRNA分子具有不同的翻译效率,它们之
间的差别有时可高达数百倍。 mRNA翻译的起始效率主要由其 5‘
端的结构序列所决定,称为 核糖体结合位点 ( RBS)
核糖体结合位点
大肠杆菌核糖体结合位点包括下列四个特征结构要素,
位于翻译起始密码子上游的 6-8个核苷酸序列 5’ UAAGGAGG 3’,
即 Shine-Dalgarno( SD) 序列, 它通过识别大肠杆菌核糖体小亚基
中的 16S rRNA 3’端区域 3’ AUUCCUCC 5’并与之专一性结合, 将
mRNA定位于核糖体上, 从而启动翻译;
翻译起始密码子, 大肠杆菌绝大部分基因以 AUG作为阅读框架的起
始位点, 但有些基因也使用 GUG或 UUG作为翻译起始密码子;
SD序列与翻译起始密码子之间的距离及碱基组成 ;
基因编码区 5’ 端若干密码子的碱基序列
核糖体结合位点的结构
核糖体结合位点
核糖体结合位点对外源基因表达的影响
SD序列的影响,
一般来说,mRNA与核糖体的结合程度越强,翻译的起始效
率就越高,而这种结合程度主要取决于 SD序列与 16S rRNA的碱
基互补性,其中以 GGAG四个碱基序列尤为重要。对多数基因而
言,上述四个碱基中任何一个换成 C或 T,均会导致翻译效率大幅
度降低
核糖体结合位点
核糖体结合位点对外源基因表达的影响
SD序列与起始密码子之间的序列的影响,
SD序列下游的碱基若为 AAAA或 UUUU,翻译效率最高;而
CCCC或 GGGG的翻译效率则分别是最高值的 50%和 25%。紧邻
AUG的前三个碱基成份对翻译起始也有影响,对于大肠杆菌 b-半
乳糖苷酶的 mRNA而言,在这个位置上最佳的碱基组合是 UAU或
CUU,如果用 UUC,UCA或 AGG取代之,则酶的表达水平低 20
倍
核糖体结合位点
核糖体结合位点对外源基因表达的影响
SD序列与起始密码子之间的距离的影响,
SD序列与起始密码子之间的精确距离保证了 mRNA在核糖体
上定位后,翻译起始密码子 AUG正好处于核糖体复合物结构中的 P
位,这是翻译启动的前提条件。在很多情况下,SD序列位于 AUG
之前大约 七个碱基 处,在此间隔中少一个碱基或多一个碱基,均
会导致翻译起始效率不同程度的降低
核糖体结合位点
核糖体结合位点对外源基因表达的影响
起始密码子及其后续若干密码子的影响,
大肠杆菌中的起始 tRNA分子可以同时识别 AUG,GUG和 UUG
三种起始密码子,但其识别频率并不相同,通常 GUG为 AUG的 50%
而 UUG只及 AUG的 25%。除此之外,从 AUG开始的前几个密码子碱
基序列也至关重要,至少这一序列不能与 mRNA的 5’ 端非编码区
形成茎环结构,否则便会严重干扰 mRNA在核糖体上的准确定位
目前广泛用于外源基因表达的大肠杆菌表达型质粒上,均含有
与启动子来源相同的核糖体结合位点序列,序列和间隔是最佳的
密码子
生物体对密码子的偏爱性
不同的生物,甚至同种生物不同的蛋白质编码基因,对简并密码
子使用频率并不相同,具有一定的偏爱性,其决定因素是,
生物基因组中的碱基含量 在富含 AT的生物(如单链 DNA噬菌体
fX174) 基因组中,密码子第三位上的 U和 A出现的频率较高;而在 GC
丰富的生物(如链霉菌)基因组中,第三位上含有 G或 C的简并密码子
占 90%以上的绝对优势
密码子与反密码子相互作用的自由能 性中等强度规律
细胞 内 tRNA的含量
如 GGG,CCC,GCG,GGC,AAA,UUU,AUA,UAU等使用少;
如 GUG,CAC,UCG,AGC,ACA,UGU,AUC,UUG等使用多;
密码子
密码子偏爱性对外源基因表达的影响
由于原核生物和真核生物基因组中密码子的使用频率具有较大程
大的差异性,因此外源基因尤其是高等哺乳动物基因在大肠杆菌中高
效翻译的一个重要因素是密码子的正确选择。一般而言,有两种策略
可以使外源基因上的密码子在大肠杆菌细胞中获得最佳表达,
外源基因全合成
同步表达相关 tRNA编码基因
密码子
密码子偏爱性对外源基因表达的影响
按照大肠杆菌密码子的偏爱性规律,设计更换外源基因中不适
宜的相应简并密码子,重组人胰岛素、干扰素以及生长激素在
大肠杆菌中的高效表达均采用了这种方法
外源基因全合成
密码子
密码子偏爱性对外源基因表达的影响
对于那些含有不和谐密码子种类单一、出现频率较高、而本身分
子量又较大的外源基因而言,则选择相关 tRNA编码基因同步克隆表达
的策略较为有利。例如,在 人尿激酶原 cDNA的 412个密码子中,共含
有 22个 精氨酸密码子,其中 7个 AGG,2个 AGA,而大肠杆菌受体细胞
中 tRNAAGG和 tRNAAGA的丰度较低。为了提高人尿激酶原 cDNA在大肠
杆菌中的高效表达,将大肠杆菌的这两个 tRNA编码基因克隆在另一个
高表达的质粒上。由此构建的大肠杆菌双质粒系统有效地解除了受体
细胞对外源基因高效表达的制约作用
同步表达相关 tRNA编码基因
质粒拷贝数
质粒拷贝数对细菌生长代谢的影响
目前实验室里广泛使用的表达型质粒在每个大肠杆菌细胞中可达
数百甚至上千个拷贝,质粒的扩增过程通常发生在受体细胞的对数生
长期内,而此时正是细菌生理代谢最旺盛的阶段。质粒分子的过度增
殖以及其后目的基因的高效表达势必会影响受体细胞的生长代谢,进
而导致重组质粒的不稳定性以及目的基因宏观表达水平的下降
解决上述难题的一种有效策略是将重组质粒的扩增纳入可控制的
轨道
质粒拷贝数
质粒扩增时序的控制
pCP3拥有一个温度可诱导型的复制子
pCP3
PL MCS
ori Apr
在 28℃ 时,每个细胞的质粒拷贝数为 60
在 42℃ 时,拷贝数迅速增至 300 - 600
在此温度下,受体细胞染色体上的 CI基
因表达的温度敏感型阻遏蛋白失活
因此,用一种手段同时控制质粒拷
贝数和基因的表达
C 大肠杆菌基因工程菌的构建策略
6 大肠杆菌基因工程
包涵体型异源蛋白的表达
分泌型异源蛋白的表达
融合型异源蛋白的表达
寡聚型异源蛋白的表达
整合型异源蛋白的表达
蛋白酶抗性或缺陷型表达系统的构建
包涵体型异源蛋白的表达
包涵体及其性质
在某些生长条件下,大肠杆菌能积累某种特殊的生物大分子,它
们致密地集聚在细胞内,或被膜包裹或形成无膜裸露结构,这种水不
溶性的结构称为 包涵体 ( Inclusion Bodies,IB)。 富含蛋白质的包涵
体多见于生长在含有氨基酸类似物培养基的大肠杆菌细胞中,由这些
氨基酸类似物所合成的蛋白质往往会丧失其理化特性和生物功能,从
而集聚形成包涵体。由高效表达质粒构建的大肠杆菌工程菌大量合成
非天然性的同源或异源蛋白质,后者在一般情况下也以包涵体的形式
存在于细菌细胞内。除此之外,包涵体中还含有少量的 DNA,RNA和
脂多糖等非蛋白分子
包涵体型异源蛋白的表达
以包涵体形式表达目的蛋白的优缺点
能简化外源基因表达产物的分离操作
包涵体表达形式的优点,
包涵体的水难溶性及其密度远大于其它细胞碎片和细胞成分,菌体
经超声波裂解后,直接通过高速离心即可将重组异源蛋白从细菌裂
解物中分离出来
能在一定程度上保持表达产物的结构稳定
在形成包涵体之后,大肠杆菌的蛋白酶降解作用基本上对异源重组
蛋白的稳定性已构不成威胁
包涵体型异源蛋白的表达
以包涵体形式表达目的蛋白的优缺点
包涵体表达形式的缺点,
以包涵体形式表达的重组蛋白丧失了原有的生物活性,必须通
过有效的变性复性操作,才能回收得到具有正确空间构象(因而具
有生物活性)的目标蛋白,因此包涵体变复性操作的效率对目标产
物的收率至关重要。然而,这也是一个技术难题,尤其当目标蛋白
分子中的 Cys残基数目较高时,体外复性蛋白质的成功率相当低,
一般不超过 30%
包涵体型异源蛋白的表达
以包涵体形式表达目的蛋白的操作
如果未进行特殊设计(如分泌型表达或融合型表达),外源基
因在大肠杆菌中表达的蛋白量占细胞总蛋白量 20%以上时,表达产
物一般倾向于形成包涵体。因此,以包涵体形式表达目的基因操作
的关键就是选择高表达的载体。事实上,这种高表达率也是包涵体
法的长处所在
包涵体型异源蛋白的表达
包涵体的变性与复性操作
C 共价修饰的蛋白质
蛋白质变性复性的动力学原理,
C1 C2 Cn C
U I 1 I n N
X1 X2 Xn X
Ag Ag Ag Ag I 有效变复性过程中的中间状态
X 脱离有效变复性过程而进入集聚的中间状态
N 天然状态的蛋白质
U 变性状态的蛋白质
A 集聚状态的蛋白质
在细菌细胞内,集聚状态 和 共价修饰 的蛋白质不能进入复性过程,因此永远成为
无活性的蛋白质。包涵体中的蛋白质就属于这两种状态,因此需要在体外进行人
工变性(解除共价修饰和驱散集聚体)复性操作
包涵体型异源蛋白的表达
包涵体的变性与复性操作
包涵体的溶解与变性,
包涵体的溶解与变性的主要任务是拆开错配的 二硫键 和 次级键
在人工条件下,使包涵体溶解并重新进入复性途径中。能有效促进
包涵体溶解变性的试剂和条件包括,
清洗剂 SDS,正十二醇肌氨酸,廉价,但影响复性和纯化
促溶剂 盐酸胍,尿素,前者昂贵,尿素便宜,但常被自发
形成的氰酸盐污染,后者能与多肽链中的氨基反应
混合溶剂 如 尿素与醋酸、二甲基砜等联合使用,溶解力增强
极端 pH 廉价,但许多蛋白质在极端 pH条件下发生修饰反应
包涵体型异源蛋白的表达
包涵体的变性与复性操作
包涵体的复性与重折叠( refolding),
包涵体的复性与重折叠的主要任务是,
通过 次级键 的形成使蛋白质复性
将多肽链中被拆开的 游离巯基 重新折叠
包涵体型异源蛋白的表达
包涵体的变性与复性操作
包涵体的复性与重折叠( refolding),复性操作
包涵体复性操作的方法包括,
分段稀释法,逐步降低变性剂的浓度,防止二次集聚的发生
一步稀释法,蛋白复性与浓度无关,但集聚与浓度关系很大
试剂添加法,精氨酸、甘氨酸、甘油、蔗糖,PEG,Ca2+
蛋白修饰法,氨基柠檬酸酐酰化,蛋白带负电,抑制集聚
产物隔离法,将变性的蛋白分子固定化,避免其相互碰撞
分子伴侣法,GroEL,GroES,DnaK,固定化,共表达
包涵体型异源蛋白的表达
包涵体的变性与复性操作
包涵体的复性与重折叠( refolding),二硫键形成
在包涵体变性体系中,始终存在着还原剂,使多肽链中的巯基保持还原状态,防
化学氧化法( A) 需要电子受体,最廉价的电子受体为空气,二硫键形成是
二硫键交换( B) 需要还原型和氧化型谷胱甘肽( GSH和 GSSG),二硫键
止二硫键错配导致严重的集聚。在变性操作结束后,这些游离型的巯基必须重新
配对形成二硫键,此时多肽链也重新发生折叠。形成二硫键的方式主要有,
随机的,仅适用于那些不含游离半胱氨酸残基的蛋白质的重折叠
形成相对特异,因此适用性较广,重折叠效果好
HS
HS
S
S
+ 2e + 2H+
A HS
HS
S-S-R
HS
+
B
R-S-S-R
S
S
2R-SH
分泌型异源蛋白的表达
在大肠杆菌中表达的异源蛋白按其在细胞中的定位可分为两种形
式:即以可溶性或不溶性(包涵体)状态存在于细胞质中;或者通过
运输或分泌方式定位于细胞周质,甚至穿过外膜进入培养基中。蛋白
产物 N端 信号肽 序列的存在是蛋白质分泌的前提条件
分泌型异源蛋白的表达
以分泌形式表达目的蛋白的优缺点
分泌表达形式的优点,
目的蛋白稳定性高 重组人胰岛素原若分泌到细胞周中,其稳
稳定性大约是在细胞质中的 10倍
目的蛋白易于分离
目的蛋白末端完整 相当多的真核生物成熟蛋白 N端并不含有
甲硫氨酸残基。当这些真核基因在大肠杆菌中表达时,蛋白质
N端的甲硫氨酸残基往往不能被切除。如若将外源基因与大肠
杆菌的 信号肽编码序列重组在一起,一旦分泌型表达,其 N端
的甲硫氨酸残基便可在信号肽的剪切过程中被有效除去
分泌型异源蛋白的表达
以分泌形式表达目的蛋白的优缺点
分泌表达形式的缺点,
相对其它生物细胞而言,大肠杆菌的蛋白分泌机制并不健
全。外源真核生物基因很难在大肠杆菌中进行分泌型表达,少
数外源基因既便能分泌表达,但其表达率通常要比包涵体方式
低很多,因此目前用于产业化的异源蛋白分泌型重组大肠杆菌
尽管有,但并不普遍
分泌型异源蛋白的表达
蛋白质的分泌机制
原核细菌周质中含有多
种 分子伴侣 可阻止分泌
蛋白的随机折叠, 分泌
在细胞周质或培养基中
的重组蛋白很少形成分
子间的二硫键交联,因
此与包涵体相比,分泌
型重组蛋白具有较高比
例的正确构象,生物活
性的回收率增加,且对
蛋白酶不敏感
分泌型异源蛋白的表达
分泌型目的蛋白表达系统的构建
包括大肠杆菌在内的绝大多数革兰氏阴性菌不能将蛋白质直接分
泌到胞外,但有些革兰氏阴性菌能将细菌的抗菌蛋白(细菌素)分泌
到培养基中,这一过程严格依赖于细菌素释放蛋白,它激活定位于内
上的磷酸酯酶,导致细菌内外膜的通透性增大。
因此,只要将细菌素释放蛋白编码基因克隆在一个合适的质粒上
即可构建完全分泌型的受体细胞。此时,用另一种携带大肠杆菌信号
肽编码序列和目的基因的表达质粒转化上述完全分泌型受体细胞,并
使用相同性质的启动子介导目的基因的转录,则可实现目的蛋白从重
组大肠杆菌中的完全分泌。
融合型异源蛋白的表达
除了直接表达异源蛋白外,还可将外源基因与受体菌自身的蛋白
质编码基因拼接在一起,并作为一个开放型 阅读框架 进行表达。由这
种杂合基因表达出的蛋白质称为 融合蛋白 。在这种融合蛋白结构中,
通常受体细菌的蛋白部分位于 N端,异源蛋白位于 C端。通过在 DNA水
平上人工设计引入的蛋白酶切割位点或化学试剂特异性断裂位点,可
以在体外从纯化的融合蛋白分子中释放回收异源蛋白
融合型异源蛋白的表达
以融合形式表达目的蛋白的优缺点
目的蛋白稳定性高 尤其对分子量较小的多肽效果更佳
目的蛋白易于分离 利用受体蛋白成熟的抗体、配体、底物进
目的蛋白表达率高 与受体蛋白共用一套完善的表达元件
胞内形成良好的空间构象,且大多具有水溶性
目的蛋白。在实际生产中,产品主要的成本往往就在该工段
行亲和层析,可以快速获得纯度较高的融合蛋白
目的蛋白溶解性好 由于受体蛋白的存在,融合蛋白往往能在
目的蛋白需要回收 融合蛋白需要裂解和进一步分离,才能获
融合型异源蛋白的表达
融合型目的蛋白表达系统的构建
融合蛋白表达质粒的构建原则,
受体细胞的结构基因能高效表达,且其表达产物可以通过亲和
层析进行特异性简单纯化
两个结构基因拼接位点处的序列设计十分重要,它直接决定着
为目的蛋白分离回收创造条件
外源基因应装在受体蛋白编码基因的下游,为融合蛋白提供终
止密码子。在某些情况下,并不需要完整的受体结构基因,目
的是尽可能避免融合蛋白分子中两种组份的分子量过于接近,
融合蛋白的裂解工艺
两个蛋白编码序列应保持一致的翻译阅读框架
融合型异源蛋白的表达
融合型目的蛋白表达系统的构建
用于融合蛋白构建的受体蛋白,
谷胱甘肽转移酶( GST) 维持良好空间构象
硫氧化还原蛋白( TrxA) 维持良好空间构象 pTrxFus
麦芽糖结合蛋白( MBP) 促进分泌
金黄色葡萄球菌蛋白 A( SAPA) 免疫亲和层析 pRIT2T
外膜蛋白( OmpF) 促进分泌
b-半乳糖苷酶( LacZ) 免疫亲和层析
泛素蛋白( Ubi) 维持良好空间构象
融合型异源蛋白的表达
目的蛋白的回收
融合蛋白中受体蛋白部分的存在可能会影响目的蛋白的空
间构象和生物活性,如果将之注入人体还会导致免疫反应,因
此在制备和生产药用目的蛋白时,将融合蛋白中的受体蛋白部
分完整除去是必不可少的工序。融合蛋白的位点专一性断裂方
法有两种,
化学断裂法
酶促裂解法
融合型异源蛋白的表达
目的蛋白的回收
用于蛋白位点专一性化学断裂的最佳试剂为 溴化氰 ( CNBr)
它与多肽链中的 甲硫氨酸 残基侧链的 硫醚基 反应,生成溴化亚氨内
酯,后者不稳定,在水的作用下肽键断裂,形成两个多肽降解片段
其中 上游肽段 的甲硫氨酸残基转化为 高丝氨酸 残基,而下游肽段 N
端的第一位氨基酸残基保持不变。这一方法的优点是回收率高(可
达到 85%以上),专一性强,而且所产生的目的蛋白的 N端不含甲
硫氨酸,与真核生物细胞中的成熟表达产物较为接近。然而,如果
异源蛋白分子内部含有甲硫氨酸残基,则不能用此方法
化学断裂法,
融合型异源蛋白的表达
目的蛋白的回收
酶促裂解法,单残基位点
蛋白内切酶 切割位点
梭菌蛋白酶 Arg-C
葡萄球菌蛋白酶 Glu-C
假单孢菌蛋白酶 Lys-C
猪胰蛋白酶 Arg-C
Lys-C
蛋白酶酶促裂解法的特点是断裂效率更高,
同时每种蛋白酶均具有相应的 断裂位点决定
簇,因此可供选择的专一性断裂位点范围较
广。几种断裂位点专一性最强的商品化蛋白
酶分别在多肽链中的 精氨酸, 谷氨酸、赖氨
酸 残基处切开酰胺键,形成不含上述残基的
下游断裂肽段,与溴化氰化学断裂法相似。
用上述蛋白酶裂解融合蛋白的前提条件是外
源蛋白分子内部不能含有精氨酸、谷氨酸或
赖氨酸残基,如果外源基因表达产物为小分子多肽,这一限制条件并不苛刻,但
大分子量的异源蛋白来说,上述三种氨基酸残基的出现频率是相当高的
Arg C N N C
受体蛋白 目的蛋白
融合型异源蛋白的表达
目的蛋白的回收
酶促裂解法,多残基位点
为了克服仅切单一氨基酸残基的蛋白酶所带来的应用局限性,
可在受体蛋白编码序列与不含起始密码子的外源基因之间加装一段
编码 寡肽序列 ( Ile-Glu-Gly-Arg) 的人工接头片段,该寡肽为具有
蛋白酶活性的 凝血因子 Xa的识别和作用序列,其断裂位点在 Arg的
C末端 。纯化后的融合蛋白用 Xa处理,即可获得不含上述寡肽序列
的目的蛋白。由于 Xa的识别作用序列由四个氨基酸残基组成,大
多数蛋白质中出现这种寡肽序列的概率极少,因此这种方法可广泛
用于从融合蛋白中回收各种不同大小的目的蛋白产物
融合型异源蛋白的表达
目的蛋白的回收
酶促裂解法,多残基位点
启动子 受体基因 接头 目的基因
Met Arg Stop
Lys
Glu
Ile-Glu-gly-Arg Arg Lys
Glu
Ile-Glu-gly-Arg
表达
亲和层析
酶解回收
融合型异源蛋白的表达
目的蛋白的回收
酶促裂解法,多残基位点
Pinpoint Xa
tac
生物素结合肽编码序列
Xa因子识别位点编码序列
SP6
T7
Apr
ori
MCS
ATC GAA GGT CGC GAA GCT TCA GCT GGG ATC CGG TAC CGA TAT CAG ATC TCC CGG GGC GGC CGC Xa-1
Ile Glu Gly Arg Glu
ATC GAA GGT CGC GAA AGC TTC AGC TGG GAT CCG GTA CCG ATA TCA GAT CTC CCG GGG CGG CCG C Xa-2
ATC GAA GGT CGC GAA AAG CTT CAG CTG GGA TCC GGT ACC GAT ATC AGA TCT CCC GGG GCG GCC GC Xa-3
NruI HindIII PvuII BamHI KpnI EcoRV BglII SmaI NotI
Xa因子切割位点
寡聚型异源蛋白的表达
从理论上讲,外源基因的表达水平与受体细胞中可转录基因的拷
贝数(即 基因剂量 )呈正相关。然而重组质粒除了含有外源基因外,
还携带其它的可转录基因,如作为筛选标记的抗生素抗性基因等。随
着重组质粒拷贝数的不断增加,受体细胞内的大部分能量和原料被用
于合成所有的重组质粒编码蛋白,而细胞的正常生长代谢却因能量不
济受到影响,因此通过增加质粒拷贝数提高外源基因表达产物的产量
往往不能获得满意的效果。
另一种通过增加外源基因剂量而提高目标蛋白产量的有效方法是
构建 寡聚串联型异源蛋白表达载体,即将多拷贝的外源基因克隆在一
个低拷贝质粒上,以取代单拷贝外源基因在高拷贝载体上表达的策略
寡聚型异源蛋白的表达
以寡聚形式表达目的蛋白的优缺点
目的蛋白高效表达
在不提高质粒拷贝数的前提下,增加目的基因的拷贝数,可以
稳定表达小分子短肽
在一定程度上改善表达量
目的产物回收困难
短肽由于缺乏有效的空间结构,在细菌细胞中的半衰期较短。
串联短肽具有与蛋白质相似的长度及空间结构,因而抗蛋白酶
降解的能力大幅度提高
寡聚短肽需要裂解和进一步分离,才能获最终分子,但 裂解后
的短肽分子容易出现序列不均一性
寡聚型异源蛋白的表达
寡聚型目的蛋白表达系统的构建
P SD gene gene gene gene T1 T2
H2N COOH
Met Met Met Met
mRNA
CNBr
基本战略,
寡聚型异源蛋白的表达
寡聚型目的蛋白表达系统的构建
构建举例,
P SD T1 T2
EcoRI BamHI AATTCAGATCT
GTCTAGA
G
CCTAG
EcoRI Bgl II BamHI
EcoRI BamHI
Bgl II
GATCT
A
G
CCTAG
EcoRI BamHI
Bgl II
EcoRI BamHI
Bgl II
EcoRI + BamHI
Bgl II + BamHI
BamHI
整合型异源蛋白的表达
以整合形式表达目的蛋白的优缺点
目的基因稳定表达
整合型的目的基因随受体细胞染色体 DNA的复制而复制,在大
多数情况下相当稳定,工程菌在没有选择压力存在下可以连续
目的基因表达率低
单拷贝整合的目的基因表达率受到限制,此时可通过强化表达
元件而加以补偿
培养而不丢失目的基因表达盒,这对以改良物种遗传性状为目
的的基因工程案例特别有意义
整合型异源蛋白的表达
DNA体内重组的基本原理
在生物体细胞尤其是原核细菌细胞内,广泛存在着 DNA
的遗传重组机制,其可能的生物学功效是促进生物种群的进
化。细胞内的 遗传重组 可分为两大类,
转位因子依赖型
同源序列依赖型
整合型异源蛋白的表达
DNA体内重组的基本原理
转位因子 是指生物细胞内天然存在的一类无复制能力的 DNA可
移动因子,不同生物种群拥有结构不同的转位因子,例如,
转位因子依赖型的体内重组,转位因子家族
噬菌体 G片段( G-Fragment)
原核细菌 插入顺序( IS)
真核细菌 转座子( Tn,Ty)
高等植物 可移动因子( Ac,Ds)
高等动物 跳跃基因( mobil gene)
整合型异源蛋白的表达
DNA体内重组的基本原理
转位因子依赖型的体内重组,转位因子的结构
IS( 1 kb)
Ty( 5 kb)
Tn( 2 - 20 kb)
ACCATGGTT TTGGTACCA
抗药性基因
转位酶基因
识别位点 阻遏基因
IR IR
IR IR
IS IS
整合型异源蛋白的表达
DNA体内重组的基本原理
转位因子依赖型的体内重组,整合形式
整合型异源蛋白的表达
DNA体内重组的基本原理
在很多原核细菌细胞中, 染色体 DNA链上的两个同源区之间可
发生所谓的同源重组, 其频率与细菌种类, 两个同源区之间的距离
同源区的长度, 同源程度密切相关 。 一般地说, 距离越远, 长度越
长, 同源性越高, 重组的频率也就越高, 反之亦然 。
同源重组有 整合 和 交换 两种形式,前者只需要一个断裂位点,
而后者涉及两个断裂位点
同源序列依赖型的体内重组,基本形式
整合型异源蛋白的表达
DNA体内重组的基本原理
同源序列依赖型的体内重组,同源整合
ori
目的基因
同源区域
标记基因
整合位点
染色体 DNA
整合型异源蛋白的表达
DNA体内重组的基本原理
同源序列依赖型的体内重组,同源交换
ori
目的基因
同源区域
标记基因
交换区域
染色体 DNA
ori
标记基因
+
蛋白酶抗性或缺陷型表达系统的构建
无论是在真核生物还是在原核细胞中,重组目的蛋白表
达后都会面临被降解的命运,其稳定性甚至还不如半衰期较
短的受体细胞内源性蛋白质。
在大多数情况下,重组目的蛋白的不稳定性可归结为对
受体细胞蛋白酶系统的敏感性。然而越来越多的实验表明,
重组目的蛋白在受体细胞内的半衰期可以通过蛋白序列的人
工设计以及受体细胞的改造加以调整和控制。
蛋白酶抗性或缺陷型表达系统的构建
实验结果表明,大多数不稳定的重组目的蛋白是被大肠杆菌
中的蛋白酶 La和 Ti降解的,两者分别由 lon和 clp基因编码,其蛋
白水解活性依赖于 ATP。 lon基因由热休克等环境压力激活,细
胞内异常蛋白或重组异源蛋白的过量表达也可作为一种环境压力
诱导 lon基因的表达。 lon-的 大肠杆菌突变株可使原来半衰期较短
的细菌调控蛋白(如 SulA,RscA,lN) 稳定性大增,因此被广
泛用作外源基因高效表达的受体菌。
蛋白酶缺陷型受体细胞的改造
lon基因缺陷的大肠杆菌受体( lon -),
蛋白酶抗性或缺陷型表达系统的构建
大肠杆菌中庞大的热休克蛋白家族对异常或 异源蛋白的降解
也有重要作用,其机理是胁迫 异常或 异源蛋白形成一种对蛋白 酶
识别和降解较有利的空间构象,从而提高 异常或 异源蛋白对蛋白
酶的敏感性。热休克基因 dnaK,dnaJ,groEL,grpE以及环境
压力特异性 s因子编码基因 htpR的突变株均呈现出对异源蛋白降
解作用的严重缺陷,特别是 lon-htpR-的双缺陷株,非常适合高效
表达各种不稳定的重组异源蛋白 。
蛋白酶缺陷型受体细胞的改造
htpR基因缺陷的大肠杆菌受体( htpR -),
蛋白酶抗性或缺陷型表达系统的构建
大量的实验结果表明,在所 有的极性氨基酸中,天门冬氨酸
( Asp) 的存在对提高蛋白质稳定性的效应最显著,而且 Asp残
基离 C末端 越近,蛋白质的稳定性就越大。更为重要的是,在多
种结构和功能相互独立的蛋白质 C末端引入 Asp残基,都能显著
地延长这些蛋白质的半衰期,因此具有普遍意义 。
抗蛋白酶的重组异源蛋白序列的设计
多肽链 C末端氨基酸序列对稳定性的影响,
蛋白酶抗性或缺陷型表达系统的构建
大量的实验结果同时表明,如果多肽链的 N末端序列中含有
较高比例的 Ala,Asn,Cys,Gln,His,则蛋白质的稳定性显著
改善。
相反,N末端含有 Pro,Glu,Ser,Thr的真核生物蛋白质,
在真核和原核细胞中的半衰期通常很短, 尤其 Pro-Glu-Ser-Thr
序列 ( PEST序列 ),是胞内蛋白酶的超敏感区。
抗蛋白酶的重组异源蛋白序列的设计
多肽链 N末端氨基酸序列对稳定性的影响,
D 基因工程菌的遗传不稳定性及其对策
6 大肠杆菌基因工程
基因工程菌遗传不稳定性的表现与机制
改善基因工程菌不稳定性的策略
基因工程菌遗传不稳定性的表现与机制
工程菌遗传不稳定性的表现形式
基因工程菌的遗传不稳定性主要表现在重组质粒的不稳定性,
这种不稳定性具有下列两种表现形式,
结构不稳定性
重组 DNA分子上某一区域发生缺失、重排、修饰,导致
其表观生物学功能的丧失
分配不稳定性
整个重组 DNA分子从受体细胞中逃逸( curing)
基因工程菌遗传不稳定性的表现与机制
工程菌遗传不稳定性的产生机制
受体细胞中的限制修饰系统对外源重组 DNA分子的降解
能量、物质的匮乏和外源基因表达产物的毒性诱导受体细胞
外源基因的高效表达严重干扰受体细胞正常的生长代谢
产生应激反应:关闭合成途径,启动降解程序
重组质粒在受体细胞分裂时的不均匀分配
这是重组质粒逃逸的基本原因
受体细胞中内源性的转座元件促进重组分子的缺失重排
基因工程菌遗传不稳定性的表现与机制
重组质粒的逃逸率
一部分细胞不再携带重组质粒,这些空载细胞数与总细胞数之比称为
当含有重组质粒的工程菌在非选择性条件下生长时,培养系统中
称为重组质粒的 宏观逃逸率 。重组质粒逃逸的原因有,
高温培养、表面活性剂( SDS),药物(利福平)、染料(
吖啶)促使重组质粒渗漏
受体细胞中的核酸酶降解重组质粒
重组质粒在受体细胞分裂时不均匀分配,细胞所含重组质粒
拷贝数的差异随着细胞分裂次数的增多而加剧
改善基因工程菌不稳定性的策略
改进载体受体系统
以增大质粒稳定性为目的的构建方法包括,
将 R1质粒上的 parB基因引入表达型载体中,其表达产物可以
选择性地杀死由于分配不均匀所产生的无质粒细胞
正确设置载体上的多克隆位点,禁止 DNA片段插在稳定区内
将受体细胞的致死性基因安装在载体上,同时构建条件致死
性的相应受体系统,如大肠杆菌的 ssb基因( DNA单链结合
蛋白编码基因
改善基因工程菌不稳定性的策略
施加选择压力
根据载体上的抗药性标记,向培养系统中添加相应的抗生素
药物和食品生产时禁止使用抗生素
根据载体上的营养缺陷型标记,向培养系统中添加相应的营
培养基复杂,成本较高
养组份
改善基因工程菌不稳定性的策略
控制目的基因的过量表达
使用可控型启动子控制目的基因的定时表达及表达程度
使用可控型复制子控制质粒的定时增殖或降低质粒的拷贝数
优化基因工程菌的培养工艺
培养基组成,限制培养基比丰富培养基更有利于稳定
培养温度,较低的培养温度有利于重组质粒的稳定
E 利用重组大肠杆菌生产人胰岛素
6 大肠杆菌基因工程
胰岛素的结构及其生物合成
人胰岛素的生产方法
重组人胰岛素的大肠杆菌工程菌的构建
胰岛素的结构及其生物合成
S
S
S
S
C
N
S S
B 肽( 30)
C 肽( 31)
A 肽( 21)
R
R
R
K
S
S
S
S
C
N
S S
N
C
高尔基体内的特异性肽酶
N C
信号肽 B 肽 C 肽 A 肽 信号肽酶
人胰岛素的生产方法
直接提取法制人胰岛素
迄今为止,有四种大规模生产人胰岛素的方法,
早期人的胰岛素是从人的胰脏中直接分离纯化的,由于原料
供应的限制,其产量远远不能满足日益增多的糖尿病人的临
床需求。
人胰岛素的生产方法
化学合成法制人胰岛素
根据人胰岛素 A链和 B链的序列,由单个氨基酸从头合成。这
条化学全合成的路线从技术上来说是能够做到的,但其生产
成本奇高,从而也限制了产品的广泛应用。
人胰岛素的生产方法
化学转型法制人胰岛素
猪的胰岛素可从原料丰富的猪胰脏中提取获得,而且猪胰岛素
与人胰岛素只在 B链的 C末端有一个氨基酸的差异,猪的为 Ala,人
的为 Thr,因此将猪胰岛素在体外酶促转化为人胰岛素不失为一种
选择。
上述思路的技术路线是:在 pH为 6-7的有机相中使胰蛋白酶催
化其逆反应,该酶在过量的苏氨酸叔丁酯的存在下,将猪胰岛素 B
链 C末端的丙氨酸交换下来,所形成的人胰岛素叔丁酯再用三氯乙
酸脱去叔丁酯基团,最终获得人胰岛素。该过程的总转化率为 60%
但工艺路线耗时,分离纯化操作复杂,产品的价格不菲。
人胰岛素的生产方法
基因工程法制人胰岛素
1982年,美国 Ely LiLi公司首先使用重组大肠杆菌生产人胰岛
素,成为世界上第一个上市的基因工程药物。 1987年,Novo公司
又推出了利用重组酵母菌生产人胰岛素的新工艺。
上述由基因工程菌合成的重组人胰岛素在体外胰岛素 受体结合
性能, 淋巴细胞和成纤维细胞的应答能力, 降血糖作用, 血浆药代
动力学 等指标上均与天然胰岛素没有任何区别,而且还具有 无免疫
原性, 注射吸收迅速等 优点,充分展示了基因工程在生物医药领域
中的巨大潜力。
重组人胰岛素的大肠杆菌工程菌的构建
A链和 B链分别表达法
基因工程菌的构建战略,tac tac
b-Gal b-Gal
A peptide B peptide
ori ori
Apr Apr Met Met
Met Met
M M
N C
M M
N C
化学合成 A链
和 B链的编码
序列
重组人胰岛素的大肠杆菌工程菌的构建
A链和 B链分别表达法
表达产物的后处理路线,
M M
N C
M M
N C
b-Gal b-Gal A B
CNBr 处理
N C
S
S
S
S
C
N
S S
N
C
N C N C N C
Cys 体外氧化和重折叠 分离纯化
重组人胰岛素的大肠杆菌工程菌的构建
A链和 B链分别表达法
生产技术的评价,
由于 A链和 B链上共存在六个半胱氨酸残基,体外二硫键的正
确配对率较低,通常只有 10% - 20%,因此采用这条工艺路线生
产的重组人胰岛素每克成本高达 100美元 以上。
为了进一步降低生产成本,美国 Ely LiLi公司随后又建立了第
二条生产重组人胰岛素的工艺路线。
重组人胰岛素的大肠杆菌工程菌的构建
人胰岛素原表达法
基因工程菌的构建战略,
tac
b-Gal
C peptide
ori
Apr
Met
Met
M M
N C
B peptide
A peptide
人胰岛素原的 cDNA 重组人胰岛素原
转化
分离纯化
重组人胰岛素的大肠杆菌工程菌的构建
人胰岛素原表达法
表达产物的后处理路线,
S
S
S
S
C
N
胰蛋白酶
C peptide
A peptide
B peptide
M
R
R
K
R
CNBr
R
S
S
S
S
C
N
N
C
S S
S S
R 羧肽酶 B
B链中第 22位上的 Arg和第 29
位上的 Lys由于良好折叠的原
因,对胰蛋白酶不敏感
重组人胰岛素的大肠杆菌工程菌的构建
人胰岛素原表达法
生产技术的评价,
在人胰岛素原表达工艺中,由于 C肽的存在,胰岛素原能形成
良好的空间构象,三对二硫键的正确配对率也相应提高,折叠率高
达 80%以上。虽然这条工艺路线并不比 AB链分别表达法更为简捷,
而且还要使用两种高纯度的酶制剂,但理想的折叠率在很大程度上
弥补了工艺繁琐的缺陷,使得每克最终产品的成本仅 50美元 。
目前美国 Ely LiLi公司采用此工艺年产 十几吨 的重组人胰岛素。
重组人胰岛素的大肠杆菌工程菌的构建
A链和 B链同时表达法
tac
b-Gal
ori
Apr
Met
Met
M M
N C
B peptide
A peptide
化学合成 AB链编码序列
重组人胰岛素
转化
分离纯化
CNBr 处理
特异性裂解 体外折叠
重组人胰岛素的大肠杆菌工程菌的构建
分泌型重组人胰岛素表达法
上述三种重组大肠杆菌的构建路线均采用胰岛素或胰岛素原编
码序列与大肠杆菌 b-半乳糖苷酶 基因拼接的方法,所产生的融合型
重组蛋白表达率高、稳定性强,但不能分泌,只要以包涵体的形式
存在于胞质中。一种能促进融合蛋白分泌的工程菌构建策略是将胰
岛素或胰岛素原编码序列与 b-內酰胺酶 基因拼接,b-內酰胺酶通常
能被大肠杆菌分泌到胞外。由此获得的工程菌同时具备了稳定高效
表达可分泌型融合蛋白的优良特性,为胰岛素的后续分离纯化工序
减轻了负担。
基 因 工 程
华东理工大学 张惠展
基因工程
5
2
3
4
1
6
7
8
9
基因工程的基本概念
基因工程的基本原理
基因工程所需的基本条件
基因工程的操作过程
目的基因的克隆与基因文库的构建
大肠杆菌基因工程
酵母基因工程
哺乳动物基因工程
高等植物基因工程
D 基因工程菌的遗传不稳定性及其对策
6 大肠杆菌基因工程
C 大肠杆菌基因工程菌的构建策略
B 外源基因在大肠杆菌中高效表达的原理
A 大肠杆菌作为表达外源基因受体菌的特征
E 利用重组大肠杆菌生产人胰岛素
A 大肠杆菌作为表达外源基因受体菌的特征
6 大肠杆菌基因工程
大肠杆菌表达外源基因的优势
全基因组测序,共有 4405个开放型阅读框架
基因克隆表达系统成熟完善
繁殖迅速、培养简单、操作方便、遗传稳定
被美国 FDA批准为安全的基因工程受体生物
A 大肠杆菌作为表达外源基因受体菌的特征
6 大肠杆菌基因工程
大肠杆菌表达外源基因的劣势
缺乏对真核生物蛋白质的复性功能
缺乏对真核生物蛋白质的修饰加工系统
内源性蛋白酶降解空间构象不正确的异源蛋白
细胞周质内含有种类繁多的内毒素
B 外源基因在大肠杆菌中高效表达的原理
6 大肠杆菌基因工程
启动子
终止子
核糖体结合位点
密码子
质粒拷贝数
启动子
启动子最佳距离的探测
目的基因
E E
A
E E
启动子
A 酶切开
Bal31酶解
目的基因
启动子
启动子的筛选
Apr
ori
galK pKO1
终止密码子 采用鸟枪法战略,将合适大小的 DNA片段
克隆到启动子探针质粒 pKO1上
受体细胞染色体 DNA上的 galE,galT与质
粒上报告基因 galk的表达产物联合作用,
可将培养基中的半乳糖酵解成红色素物质
转化 galE+,galT+,galK-的大肠杆菌受体菌株
含有外源启动子活性的重组克隆
启动子
启动子的构建
-35 区序列 -10 区序列
PlL
PrecA
Ptrp
Plac
PtraA
Ptac
启动子
T T G A C A G A T A C T
T T G A T A T A T A A T
T T G A C A T T A A C T
T A G A C A T A A T G T
T T T A C A T A T A A T
T T G A C A T A T A A T
Ptac = 3 Ptrp = 11 Plac
启动子
启动子的可控性
P
乳糖启动子 Plac的可控性,
O
P O
高效转录
阻遏蛋白
诱导
乳糖 异丙基 -b-D-硫
代半乳糖苷( IPTG)
野生型的 Plac与其控制区 Olac
偶联在一起,在没有诱导物
存在时,整个操纵子处于基
基底水平转录
底水平表达;诱导物可以使
启动子 Plac介导的转录大幅
提高
启动子
启动子的可控性
Plac
乳糖启动子 Plac的可控性,
O
Plac O
高效转录
葡萄糖代谢
野生型的 Plac上游附近拥有
代谢激活因子( CAP) 结合
区,cAMP激活 CAP,CAP
基底水平转录
结合启动子控制区,进而促
进 Plac介导的转录。葡萄糖
代谢使 cAMP减少,也能阻
遏 Plac介导的转录。因此,
基因工程中使用的乳糖启动
子均为抗葡萄糖代谢阻遏的
突变型,即 Plac UV5
CAP
cAMP
cAMP浓度降低
Plac UV5 O
高效转录
启动子
启动子的可控性
Ptrp
色氨酸启动子 Ptrp的可控性,
Otrp
除去 色氨酸
色氨酸启动子 Ptrp受色氨酸 -阻遏
蛋白复合物的阻遏,转录呈基底
状态。在培养系统中去除色氨酸
基底水平转录
或者加入 3-吲哚丙烯酸 ( IAA),
便可有效地解除阻遏抑制作用。
在正常的细菌培养体系中,除去
色氨酸是困难的,因此基因工程
中往往添加 IAA诱导 Ptrp介导的目
基因的表达
色氨酸
或加 3-吲哚丙烯酸
高效转录
阻遏蛋白
( IAA)
Otrp Ptrp
高效转录
Otrp Ptrp
启动子
启动子的可控性
l噬菌体 启动子 PlL的可控性,
噬菌体启动子 PL受 CI阻遏蛋白阻
遏,很难直接诱导控制。在基因
工程中常使用温度敏感型的 cI突
变基因 cI857控制 PL。 cI857阻遏蛋
在 42℃ 时失活脱落,PL便可介导
目的基因的表达。但在大型细菌
培养罐中迅速升温非常困难,因
此常使用一个双质粒控制系统,
用色氨酸间接控制目的基因表达
Ptrp
A B
cI857
PL
目的基因
阻遏作用
Ptrp
A B
PL
表达 色氨酸
终止子
强化转录终止的必要性
外源基因在强启动子的控制下表达, 容易发生转录过头现象, 即 RNA聚合酶滑
过终止子结构继续转录质粒上邻近的 DNA序列, 形成长短不一的 mRNA混合物
过长转录物的产生在很大程度上会影响外源基因的表达, 其原因如下,
转录产物越长, RNA聚合酶转录一分子 mRNA所需的时间就相应增加, 外源基因
本身的转录效率下降;
如果外源基因下游紧接有载体上的其它重要基因或 DNA功能区域, 如选择性标
记基因和复制子结构等, 则 RNA聚合酶在此处的转录可能干扰质粒的复制及其它生
物功能, 甚至导致重组质粒的不稳定性;
过长的 mRNA往往会产生大量无用的蛋白质, 增加工程菌无谓的能量消耗;
更为严重的是, 过长的转录物往往不能形成理想的二级结构, 从而大大降低外源
基因编码产物的翻译效率
终止子
强终止子的选择与使用
目前外源基因表达质粒中常用的终
止子是来自大肠杆菌 rRNA操纵子上的
rrnT1T2以及 T7噬菌体 DNA上的 Tf。 对
于一些终止作用较弱的终止子,通常
可以采用二聚体终止子串联的特殊结
构,以增强其转录终止作用
终止子也可以象启动子那样,通过
特殊的探针质粒从细菌或噬菌体基因
组 DNA中克隆筛选
pCP1 Apr
ori
Tcr
筛选 Apr,Tcs的转化子
核糖体结合位点
外源基因在大肠杆菌细胞中的高效表达不仅取决于转录启动的
频率,而且在很大程度上还与 mRNA的翻译起始效率密切相关。大
肠杆菌细胞中结构不同的 mRNA分子具有不同的翻译效率,它们之
间的差别有时可高达数百倍。 mRNA翻译的起始效率主要由其 5‘
端的结构序列所决定,称为 核糖体结合位点 ( RBS)
核糖体结合位点
大肠杆菌核糖体结合位点包括下列四个特征结构要素,
位于翻译起始密码子上游的 6-8个核苷酸序列 5’ UAAGGAGG 3’,
即 Shine-Dalgarno( SD) 序列, 它通过识别大肠杆菌核糖体小亚基
中的 16S rRNA 3’端区域 3’ AUUCCUCC 5’并与之专一性结合, 将
mRNA定位于核糖体上, 从而启动翻译;
翻译起始密码子, 大肠杆菌绝大部分基因以 AUG作为阅读框架的起
始位点, 但有些基因也使用 GUG或 UUG作为翻译起始密码子;
SD序列与翻译起始密码子之间的距离及碱基组成 ;
基因编码区 5’ 端若干密码子的碱基序列
核糖体结合位点的结构
核糖体结合位点
核糖体结合位点对外源基因表达的影响
SD序列的影响,
一般来说,mRNA与核糖体的结合程度越强,翻译的起始效
率就越高,而这种结合程度主要取决于 SD序列与 16S rRNA的碱
基互补性,其中以 GGAG四个碱基序列尤为重要。对多数基因而
言,上述四个碱基中任何一个换成 C或 T,均会导致翻译效率大幅
度降低
核糖体结合位点
核糖体结合位点对外源基因表达的影响
SD序列与起始密码子之间的序列的影响,
SD序列下游的碱基若为 AAAA或 UUUU,翻译效率最高;而
CCCC或 GGGG的翻译效率则分别是最高值的 50%和 25%。紧邻
AUG的前三个碱基成份对翻译起始也有影响,对于大肠杆菌 b-半
乳糖苷酶的 mRNA而言,在这个位置上最佳的碱基组合是 UAU或
CUU,如果用 UUC,UCA或 AGG取代之,则酶的表达水平低 20
倍
核糖体结合位点
核糖体结合位点对外源基因表达的影响
SD序列与起始密码子之间的距离的影响,
SD序列与起始密码子之间的精确距离保证了 mRNA在核糖体
上定位后,翻译起始密码子 AUG正好处于核糖体复合物结构中的 P
位,这是翻译启动的前提条件。在很多情况下,SD序列位于 AUG
之前大约 七个碱基 处,在此间隔中少一个碱基或多一个碱基,均
会导致翻译起始效率不同程度的降低
核糖体结合位点
核糖体结合位点对外源基因表达的影响
起始密码子及其后续若干密码子的影响,
大肠杆菌中的起始 tRNA分子可以同时识别 AUG,GUG和 UUG
三种起始密码子,但其识别频率并不相同,通常 GUG为 AUG的 50%
而 UUG只及 AUG的 25%。除此之外,从 AUG开始的前几个密码子碱
基序列也至关重要,至少这一序列不能与 mRNA的 5’ 端非编码区
形成茎环结构,否则便会严重干扰 mRNA在核糖体上的准确定位
目前广泛用于外源基因表达的大肠杆菌表达型质粒上,均含有
与启动子来源相同的核糖体结合位点序列,序列和间隔是最佳的
密码子
生物体对密码子的偏爱性
不同的生物,甚至同种生物不同的蛋白质编码基因,对简并密码
子使用频率并不相同,具有一定的偏爱性,其决定因素是,
生物基因组中的碱基含量 在富含 AT的生物(如单链 DNA噬菌体
fX174) 基因组中,密码子第三位上的 U和 A出现的频率较高;而在 GC
丰富的生物(如链霉菌)基因组中,第三位上含有 G或 C的简并密码子
占 90%以上的绝对优势
密码子与反密码子相互作用的自由能 性中等强度规律
细胞 内 tRNA的含量
如 GGG,CCC,GCG,GGC,AAA,UUU,AUA,UAU等使用少;
如 GUG,CAC,UCG,AGC,ACA,UGU,AUC,UUG等使用多;
密码子
密码子偏爱性对外源基因表达的影响
由于原核生物和真核生物基因组中密码子的使用频率具有较大程
大的差异性,因此外源基因尤其是高等哺乳动物基因在大肠杆菌中高
效翻译的一个重要因素是密码子的正确选择。一般而言,有两种策略
可以使外源基因上的密码子在大肠杆菌细胞中获得最佳表达,
外源基因全合成
同步表达相关 tRNA编码基因
密码子
密码子偏爱性对外源基因表达的影响
按照大肠杆菌密码子的偏爱性规律,设计更换外源基因中不适
宜的相应简并密码子,重组人胰岛素、干扰素以及生长激素在
大肠杆菌中的高效表达均采用了这种方法
外源基因全合成
密码子
密码子偏爱性对外源基因表达的影响
对于那些含有不和谐密码子种类单一、出现频率较高、而本身分
子量又较大的外源基因而言,则选择相关 tRNA编码基因同步克隆表达
的策略较为有利。例如,在 人尿激酶原 cDNA的 412个密码子中,共含
有 22个 精氨酸密码子,其中 7个 AGG,2个 AGA,而大肠杆菌受体细胞
中 tRNAAGG和 tRNAAGA的丰度较低。为了提高人尿激酶原 cDNA在大肠
杆菌中的高效表达,将大肠杆菌的这两个 tRNA编码基因克隆在另一个
高表达的质粒上。由此构建的大肠杆菌双质粒系统有效地解除了受体
细胞对外源基因高效表达的制约作用
同步表达相关 tRNA编码基因
质粒拷贝数
质粒拷贝数对细菌生长代谢的影响
目前实验室里广泛使用的表达型质粒在每个大肠杆菌细胞中可达
数百甚至上千个拷贝,质粒的扩增过程通常发生在受体细胞的对数生
长期内,而此时正是细菌生理代谢最旺盛的阶段。质粒分子的过度增
殖以及其后目的基因的高效表达势必会影响受体细胞的生长代谢,进
而导致重组质粒的不稳定性以及目的基因宏观表达水平的下降
解决上述难题的一种有效策略是将重组质粒的扩增纳入可控制的
轨道
质粒拷贝数
质粒扩增时序的控制
pCP3拥有一个温度可诱导型的复制子
pCP3
PL MCS
ori Apr
在 28℃ 时,每个细胞的质粒拷贝数为 60
在 42℃ 时,拷贝数迅速增至 300 - 600
在此温度下,受体细胞染色体上的 CI基
因表达的温度敏感型阻遏蛋白失活
因此,用一种手段同时控制质粒拷
贝数和基因的表达
C 大肠杆菌基因工程菌的构建策略
6 大肠杆菌基因工程
包涵体型异源蛋白的表达
分泌型异源蛋白的表达
融合型异源蛋白的表达
寡聚型异源蛋白的表达
整合型异源蛋白的表达
蛋白酶抗性或缺陷型表达系统的构建
包涵体型异源蛋白的表达
包涵体及其性质
在某些生长条件下,大肠杆菌能积累某种特殊的生物大分子,它
们致密地集聚在细胞内,或被膜包裹或形成无膜裸露结构,这种水不
溶性的结构称为 包涵体 ( Inclusion Bodies,IB)。 富含蛋白质的包涵
体多见于生长在含有氨基酸类似物培养基的大肠杆菌细胞中,由这些
氨基酸类似物所合成的蛋白质往往会丧失其理化特性和生物功能,从
而集聚形成包涵体。由高效表达质粒构建的大肠杆菌工程菌大量合成
非天然性的同源或异源蛋白质,后者在一般情况下也以包涵体的形式
存在于细菌细胞内。除此之外,包涵体中还含有少量的 DNA,RNA和
脂多糖等非蛋白分子
包涵体型异源蛋白的表达
以包涵体形式表达目的蛋白的优缺点
能简化外源基因表达产物的分离操作
包涵体表达形式的优点,
包涵体的水难溶性及其密度远大于其它细胞碎片和细胞成分,菌体
经超声波裂解后,直接通过高速离心即可将重组异源蛋白从细菌裂
解物中分离出来
能在一定程度上保持表达产物的结构稳定
在形成包涵体之后,大肠杆菌的蛋白酶降解作用基本上对异源重组
蛋白的稳定性已构不成威胁
包涵体型异源蛋白的表达
以包涵体形式表达目的蛋白的优缺点
包涵体表达形式的缺点,
以包涵体形式表达的重组蛋白丧失了原有的生物活性,必须通
过有效的变性复性操作,才能回收得到具有正确空间构象(因而具
有生物活性)的目标蛋白,因此包涵体变复性操作的效率对目标产
物的收率至关重要。然而,这也是一个技术难题,尤其当目标蛋白
分子中的 Cys残基数目较高时,体外复性蛋白质的成功率相当低,
一般不超过 30%
包涵体型异源蛋白的表达
以包涵体形式表达目的蛋白的操作
如果未进行特殊设计(如分泌型表达或融合型表达),外源基
因在大肠杆菌中表达的蛋白量占细胞总蛋白量 20%以上时,表达产
物一般倾向于形成包涵体。因此,以包涵体形式表达目的基因操作
的关键就是选择高表达的载体。事实上,这种高表达率也是包涵体
法的长处所在
包涵体型异源蛋白的表达
包涵体的变性与复性操作
C 共价修饰的蛋白质
蛋白质变性复性的动力学原理,
C1 C2 Cn C
U I 1 I n N
X1 X2 Xn X
Ag Ag Ag Ag I 有效变复性过程中的中间状态
X 脱离有效变复性过程而进入集聚的中间状态
N 天然状态的蛋白质
U 变性状态的蛋白质
A 集聚状态的蛋白质
在细菌细胞内,集聚状态 和 共价修饰 的蛋白质不能进入复性过程,因此永远成为
无活性的蛋白质。包涵体中的蛋白质就属于这两种状态,因此需要在体外进行人
工变性(解除共价修饰和驱散集聚体)复性操作
包涵体型异源蛋白的表达
包涵体的变性与复性操作
包涵体的溶解与变性,
包涵体的溶解与变性的主要任务是拆开错配的 二硫键 和 次级键
在人工条件下,使包涵体溶解并重新进入复性途径中。能有效促进
包涵体溶解变性的试剂和条件包括,
清洗剂 SDS,正十二醇肌氨酸,廉价,但影响复性和纯化
促溶剂 盐酸胍,尿素,前者昂贵,尿素便宜,但常被自发
形成的氰酸盐污染,后者能与多肽链中的氨基反应
混合溶剂 如 尿素与醋酸、二甲基砜等联合使用,溶解力增强
极端 pH 廉价,但许多蛋白质在极端 pH条件下发生修饰反应
包涵体型异源蛋白的表达
包涵体的变性与复性操作
包涵体的复性与重折叠( refolding),
包涵体的复性与重折叠的主要任务是,
通过 次级键 的形成使蛋白质复性
将多肽链中被拆开的 游离巯基 重新折叠
包涵体型异源蛋白的表达
包涵体的变性与复性操作
包涵体的复性与重折叠( refolding),复性操作
包涵体复性操作的方法包括,
分段稀释法,逐步降低变性剂的浓度,防止二次集聚的发生
一步稀释法,蛋白复性与浓度无关,但集聚与浓度关系很大
试剂添加法,精氨酸、甘氨酸、甘油、蔗糖,PEG,Ca2+
蛋白修饰法,氨基柠檬酸酐酰化,蛋白带负电,抑制集聚
产物隔离法,将变性的蛋白分子固定化,避免其相互碰撞
分子伴侣法,GroEL,GroES,DnaK,固定化,共表达
包涵体型异源蛋白的表达
包涵体的变性与复性操作
包涵体的复性与重折叠( refolding),二硫键形成
在包涵体变性体系中,始终存在着还原剂,使多肽链中的巯基保持还原状态,防
化学氧化法( A) 需要电子受体,最廉价的电子受体为空气,二硫键形成是
二硫键交换( B) 需要还原型和氧化型谷胱甘肽( GSH和 GSSG),二硫键
止二硫键错配导致严重的集聚。在变性操作结束后,这些游离型的巯基必须重新
配对形成二硫键,此时多肽链也重新发生折叠。形成二硫键的方式主要有,
随机的,仅适用于那些不含游离半胱氨酸残基的蛋白质的重折叠
形成相对特异,因此适用性较广,重折叠效果好
HS
HS
S
S
+ 2e + 2H+
A HS
HS
S-S-R
HS
+
B
R-S-S-R
S
S
2R-SH
分泌型异源蛋白的表达
在大肠杆菌中表达的异源蛋白按其在细胞中的定位可分为两种形
式:即以可溶性或不溶性(包涵体)状态存在于细胞质中;或者通过
运输或分泌方式定位于细胞周质,甚至穿过外膜进入培养基中。蛋白
产物 N端 信号肽 序列的存在是蛋白质分泌的前提条件
分泌型异源蛋白的表达
以分泌形式表达目的蛋白的优缺点
分泌表达形式的优点,
目的蛋白稳定性高 重组人胰岛素原若分泌到细胞周中,其稳
稳定性大约是在细胞质中的 10倍
目的蛋白易于分离
目的蛋白末端完整 相当多的真核生物成熟蛋白 N端并不含有
甲硫氨酸残基。当这些真核基因在大肠杆菌中表达时,蛋白质
N端的甲硫氨酸残基往往不能被切除。如若将外源基因与大肠
杆菌的 信号肽编码序列重组在一起,一旦分泌型表达,其 N端
的甲硫氨酸残基便可在信号肽的剪切过程中被有效除去
分泌型异源蛋白的表达
以分泌形式表达目的蛋白的优缺点
分泌表达形式的缺点,
相对其它生物细胞而言,大肠杆菌的蛋白分泌机制并不健
全。外源真核生物基因很难在大肠杆菌中进行分泌型表达,少
数外源基因既便能分泌表达,但其表达率通常要比包涵体方式
低很多,因此目前用于产业化的异源蛋白分泌型重组大肠杆菌
尽管有,但并不普遍
分泌型异源蛋白的表达
蛋白质的分泌机制
原核细菌周质中含有多
种 分子伴侣 可阻止分泌
蛋白的随机折叠, 分泌
在细胞周质或培养基中
的重组蛋白很少形成分
子间的二硫键交联,因
此与包涵体相比,分泌
型重组蛋白具有较高比
例的正确构象,生物活
性的回收率增加,且对
蛋白酶不敏感
分泌型异源蛋白的表达
分泌型目的蛋白表达系统的构建
包括大肠杆菌在内的绝大多数革兰氏阴性菌不能将蛋白质直接分
泌到胞外,但有些革兰氏阴性菌能将细菌的抗菌蛋白(细菌素)分泌
到培养基中,这一过程严格依赖于细菌素释放蛋白,它激活定位于内
上的磷酸酯酶,导致细菌内外膜的通透性增大。
因此,只要将细菌素释放蛋白编码基因克隆在一个合适的质粒上
即可构建完全分泌型的受体细胞。此时,用另一种携带大肠杆菌信号
肽编码序列和目的基因的表达质粒转化上述完全分泌型受体细胞,并
使用相同性质的启动子介导目的基因的转录,则可实现目的蛋白从重
组大肠杆菌中的完全分泌。
融合型异源蛋白的表达
除了直接表达异源蛋白外,还可将外源基因与受体菌自身的蛋白
质编码基因拼接在一起,并作为一个开放型 阅读框架 进行表达。由这
种杂合基因表达出的蛋白质称为 融合蛋白 。在这种融合蛋白结构中,
通常受体细菌的蛋白部分位于 N端,异源蛋白位于 C端。通过在 DNA水
平上人工设计引入的蛋白酶切割位点或化学试剂特异性断裂位点,可
以在体外从纯化的融合蛋白分子中释放回收异源蛋白
融合型异源蛋白的表达
以融合形式表达目的蛋白的优缺点
目的蛋白稳定性高 尤其对分子量较小的多肽效果更佳
目的蛋白易于分离 利用受体蛋白成熟的抗体、配体、底物进
目的蛋白表达率高 与受体蛋白共用一套完善的表达元件
胞内形成良好的空间构象,且大多具有水溶性
目的蛋白。在实际生产中,产品主要的成本往往就在该工段
行亲和层析,可以快速获得纯度较高的融合蛋白
目的蛋白溶解性好 由于受体蛋白的存在,融合蛋白往往能在
目的蛋白需要回收 融合蛋白需要裂解和进一步分离,才能获
融合型异源蛋白的表达
融合型目的蛋白表达系统的构建
融合蛋白表达质粒的构建原则,
受体细胞的结构基因能高效表达,且其表达产物可以通过亲和
层析进行特异性简单纯化
两个结构基因拼接位点处的序列设计十分重要,它直接决定着
为目的蛋白分离回收创造条件
外源基因应装在受体蛋白编码基因的下游,为融合蛋白提供终
止密码子。在某些情况下,并不需要完整的受体结构基因,目
的是尽可能避免融合蛋白分子中两种组份的分子量过于接近,
融合蛋白的裂解工艺
两个蛋白编码序列应保持一致的翻译阅读框架
融合型异源蛋白的表达
融合型目的蛋白表达系统的构建
用于融合蛋白构建的受体蛋白,
谷胱甘肽转移酶( GST) 维持良好空间构象
硫氧化还原蛋白( TrxA) 维持良好空间构象 pTrxFus
麦芽糖结合蛋白( MBP) 促进分泌
金黄色葡萄球菌蛋白 A( SAPA) 免疫亲和层析 pRIT2T
外膜蛋白( OmpF) 促进分泌
b-半乳糖苷酶( LacZ) 免疫亲和层析
泛素蛋白( Ubi) 维持良好空间构象
融合型异源蛋白的表达
目的蛋白的回收
融合蛋白中受体蛋白部分的存在可能会影响目的蛋白的空
间构象和生物活性,如果将之注入人体还会导致免疫反应,因
此在制备和生产药用目的蛋白时,将融合蛋白中的受体蛋白部
分完整除去是必不可少的工序。融合蛋白的位点专一性断裂方
法有两种,
化学断裂法
酶促裂解法
融合型异源蛋白的表达
目的蛋白的回收
用于蛋白位点专一性化学断裂的最佳试剂为 溴化氰 ( CNBr)
它与多肽链中的 甲硫氨酸 残基侧链的 硫醚基 反应,生成溴化亚氨内
酯,后者不稳定,在水的作用下肽键断裂,形成两个多肽降解片段
其中 上游肽段 的甲硫氨酸残基转化为 高丝氨酸 残基,而下游肽段 N
端的第一位氨基酸残基保持不变。这一方法的优点是回收率高(可
达到 85%以上),专一性强,而且所产生的目的蛋白的 N端不含甲
硫氨酸,与真核生物细胞中的成熟表达产物较为接近。然而,如果
异源蛋白分子内部含有甲硫氨酸残基,则不能用此方法
化学断裂法,
融合型异源蛋白的表达
目的蛋白的回收
酶促裂解法,单残基位点
蛋白内切酶 切割位点
梭菌蛋白酶 Arg-C
葡萄球菌蛋白酶 Glu-C
假单孢菌蛋白酶 Lys-C
猪胰蛋白酶 Arg-C
Lys-C
蛋白酶酶促裂解法的特点是断裂效率更高,
同时每种蛋白酶均具有相应的 断裂位点决定
簇,因此可供选择的专一性断裂位点范围较
广。几种断裂位点专一性最强的商品化蛋白
酶分别在多肽链中的 精氨酸, 谷氨酸、赖氨
酸 残基处切开酰胺键,形成不含上述残基的
下游断裂肽段,与溴化氰化学断裂法相似。
用上述蛋白酶裂解融合蛋白的前提条件是外
源蛋白分子内部不能含有精氨酸、谷氨酸或
赖氨酸残基,如果外源基因表达产物为小分子多肽,这一限制条件并不苛刻,但
大分子量的异源蛋白来说,上述三种氨基酸残基的出现频率是相当高的
Arg C N N C
受体蛋白 目的蛋白
融合型异源蛋白的表达
目的蛋白的回收
酶促裂解法,多残基位点
为了克服仅切单一氨基酸残基的蛋白酶所带来的应用局限性,
可在受体蛋白编码序列与不含起始密码子的外源基因之间加装一段
编码 寡肽序列 ( Ile-Glu-Gly-Arg) 的人工接头片段,该寡肽为具有
蛋白酶活性的 凝血因子 Xa的识别和作用序列,其断裂位点在 Arg的
C末端 。纯化后的融合蛋白用 Xa处理,即可获得不含上述寡肽序列
的目的蛋白。由于 Xa的识别作用序列由四个氨基酸残基组成,大
多数蛋白质中出现这种寡肽序列的概率极少,因此这种方法可广泛
用于从融合蛋白中回收各种不同大小的目的蛋白产物
融合型异源蛋白的表达
目的蛋白的回收
酶促裂解法,多残基位点
启动子 受体基因 接头 目的基因
Met Arg Stop
Lys
Glu
Ile-Glu-gly-Arg Arg Lys
Glu
Ile-Glu-gly-Arg
表达
亲和层析
酶解回收
融合型异源蛋白的表达
目的蛋白的回收
酶促裂解法,多残基位点
Pinpoint Xa
tac
生物素结合肽编码序列
Xa因子识别位点编码序列
SP6
T7
Apr
ori
MCS
ATC GAA GGT CGC GAA GCT TCA GCT GGG ATC CGG TAC CGA TAT CAG ATC TCC CGG GGC GGC CGC Xa-1
Ile Glu Gly Arg Glu
ATC GAA GGT CGC GAA AGC TTC AGC TGG GAT CCG GTA CCG ATA TCA GAT CTC CCG GGG CGG CCG C Xa-2
ATC GAA GGT CGC GAA AAG CTT CAG CTG GGA TCC GGT ACC GAT ATC AGA TCT CCC GGG GCG GCC GC Xa-3
NruI HindIII PvuII BamHI KpnI EcoRV BglII SmaI NotI
Xa因子切割位点
寡聚型异源蛋白的表达
从理论上讲,外源基因的表达水平与受体细胞中可转录基因的拷
贝数(即 基因剂量 )呈正相关。然而重组质粒除了含有外源基因外,
还携带其它的可转录基因,如作为筛选标记的抗生素抗性基因等。随
着重组质粒拷贝数的不断增加,受体细胞内的大部分能量和原料被用
于合成所有的重组质粒编码蛋白,而细胞的正常生长代谢却因能量不
济受到影响,因此通过增加质粒拷贝数提高外源基因表达产物的产量
往往不能获得满意的效果。
另一种通过增加外源基因剂量而提高目标蛋白产量的有效方法是
构建 寡聚串联型异源蛋白表达载体,即将多拷贝的外源基因克隆在一
个低拷贝质粒上,以取代单拷贝外源基因在高拷贝载体上表达的策略
寡聚型异源蛋白的表达
以寡聚形式表达目的蛋白的优缺点
目的蛋白高效表达
在不提高质粒拷贝数的前提下,增加目的基因的拷贝数,可以
稳定表达小分子短肽
在一定程度上改善表达量
目的产物回收困难
短肽由于缺乏有效的空间结构,在细菌细胞中的半衰期较短。
串联短肽具有与蛋白质相似的长度及空间结构,因而抗蛋白酶
降解的能力大幅度提高
寡聚短肽需要裂解和进一步分离,才能获最终分子,但 裂解后
的短肽分子容易出现序列不均一性
寡聚型异源蛋白的表达
寡聚型目的蛋白表达系统的构建
P SD gene gene gene gene T1 T2
H2N COOH
Met Met Met Met
mRNA
CNBr
基本战略,
寡聚型异源蛋白的表达
寡聚型目的蛋白表达系统的构建
构建举例,
P SD T1 T2
EcoRI BamHI AATTCAGATCT
GTCTAGA
G
CCTAG
EcoRI Bgl II BamHI
EcoRI BamHI
Bgl II
GATCT
A
G
CCTAG
EcoRI BamHI
Bgl II
EcoRI BamHI
Bgl II
EcoRI + BamHI
Bgl II + BamHI
BamHI
整合型异源蛋白的表达
以整合形式表达目的蛋白的优缺点
目的基因稳定表达
整合型的目的基因随受体细胞染色体 DNA的复制而复制,在大
多数情况下相当稳定,工程菌在没有选择压力存在下可以连续
目的基因表达率低
单拷贝整合的目的基因表达率受到限制,此时可通过强化表达
元件而加以补偿
培养而不丢失目的基因表达盒,这对以改良物种遗传性状为目
的的基因工程案例特别有意义
整合型异源蛋白的表达
DNA体内重组的基本原理
在生物体细胞尤其是原核细菌细胞内,广泛存在着 DNA
的遗传重组机制,其可能的生物学功效是促进生物种群的进
化。细胞内的 遗传重组 可分为两大类,
转位因子依赖型
同源序列依赖型
整合型异源蛋白的表达
DNA体内重组的基本原理
转位因子 是指生物细胞内天然存在的一类无复制能力的 DNA可
移动因子,不同生物种群拥有结构不同的转位因子,例如,
转位因子依赖型的体内重组,转位因子家族
噬菌体 G片段( G-Fragment)
原核细菌 插入顺序( IS)
真核细菌 转座子( Tn,Ty)
高等植物 可移动因子( Ac,Ds)
高等动物 跳跃基因( mobil gene)
整合型异源蛋白的表达
DNA体内重组的基本原理
转位因子依赖型的体内重组,转位因子的结构
IS( 1 kb)
Ty( 5 kb)
Tn( 2 - 20 kb)
ACCATGGTT TTGGTACCA
抗药性基因
转位酶基因
识别位点 阻遏基因
IR IR
IR IR
IS IS
整合型异源蛋白的表达
DNA体内重组的基本原理
转位因子依赖型的体内重组,整合形式
整合型异源蛋白的表达
DNA体内重组的基本原理
在很多原核细菌细胞中, 染色体 DNA链上的两个同源区之间可
发生所谓的同源重组, 其频率与细菌种类, 两个同源区之间的距离
同源区的长度, 同源程度密切相关 。 一般地说, 距离越远, 长度越
长, 同源性越高, 重组的频率也就越高, 反之亦然 。
同源重组有 整合 和 交换 两种形式,前者只需要一个断裂位点,
而后者涉及两个断裂位点
同源序列依赖型的体内重组,基本形式
整合型异源蛋白的表达
DNA体内重组的基本原理
同源序列依赖型的体内重组,同源整合
ori
目的基因
同源区域
标记基因
整合位点
染色体 DNA
整合型异源蛋白的表达
DNA体内重组的基本原理
同源序列依赖型的体内重组,同源交换
ori
目的基因
同源区域
标记基因
交换区域
染色体 DNA
ori
标记基因
+
蛋白酶抗性或缺陷型表达系统的构建
无论是在真核生物还是在原核细胞中,重组目的蛋白表
达后都会面临被降解的命运,其稳定性甚至还不如半衰期较
短的受体细胞内源性蛋白质。
在大多数情况下,重组目的蛋白的不稳定性可归结为对
受体细胞蛋白酶系统的敏感性。然而越来越多的实验表明,
重组目的蛋白在受体细胞内的半衰期可以通过蛋白序列的人
工设计以及受体细胞的改造加以调整和控制。
蛋白酶抗性或缺陷型表达系统的构建
实验结果表明,大多数不稳定的重组目的蛋白是被大肠杆菌
中的蛋白酶 La和 Ti降解的,两者分别由 lon和 clp基因编码,其蛋
白水解活性依赖于 ATP。 lon基因由热休克等环境压力激活,细
胞内异常蛋白或重组异源蛋白的过量表达也可作为一种环境压力
诱导 lon基因的表达。 lon-的 大肠杆菌突变株可使原来半衰期较短
的细菌调控蛋白(如 SulA,RscA,lN) 稳定性大增,因此被广
泛用作外源基因高效表达的受体菌。
蛋白酶缺陷型受体细胞的改造
lon基因缺陷的大肠杆菌受体( lon -),
蛋白酶抗性或缺陷型表达系统的构建
大肠杆菌中庞大的热休克蛋白家族对异常或 异源蛋白的降解
也有重要作用,其机理是胁迫 异常或 异源蛋白形成一种对蛋白 酶
识别和降解较有利的空间构象,从而提高 异常或 异源蛋白对蛋白
酶的敏感性。热休克基因 dnaK,dnaJ,groEL,grpE以及环境
压力特异性 s因子编码基因 htpR的突变株均呈现出对异源蛋白降
解作用的严重缺陷,特别是 lon-htpR-的双缺陷株,非常适合高效
表达各种不稳定的重组异源蛋白 。
蛋白酶缺陷型受体细胞的改造
htpR基因缺陷的大肠杆菌受体( htpR -),
蛋白酶抗性或缺陷型表达系统的构建
大量的实验结果表明,在所 有的极性氨基酸中,天门冬氨酸
( Asp) 的存在对提高蛋白质稳定性的效应最显著,而且 Asp残
基离 C末端 越近,蛋白质的稳定性就越大。更为重要的是,在多
种结构和功能相互独立的蛋白质 C末端引入 Asp残基,都能显著
地延长这些蛋白质的半衰期,因此具有普遍意义 。
抗蛋白酶的重组异源蛋白序列的设计
多肽链 C末端氨基酸序列对稳定性的影响,
蛋白酶抗性或缺陷型表达系统的构建
大量的实验结果同时表明,如果多肽链的 N末端序列中含有
较高比例的 Ala,Asn,Cys,Gln,His,则蛋白质的稳定性显著
改善。
相反,N末端含有 Pro,Glu,Ser,Thr的真核生物蛋白质,
在真核和原核细胞中的半衰期通常很短, 尤其 Pro-Glu-Ser-Thr
序列 ( PEST序列 ),是胞内蛋白酶的超敏感区。
抗蛋白酶的重组异源蛋白序列的设计
多肽链 N末端氨基酸序列对稳定性的影响,
D 基因工程菌的遗传不稳定性及其对策
6 大肠杆菌基因工程
基因工程菌遗传不稳定性的表现与机制
改善基因工程菌不稳定性的策略
基因工程菌遗传不稳定性的表现与机制
工程菌遗传不稳定性的表现形式
基因工程菌的遗传不稳定性主要表现在重组质粒的不稳定性,
这种不稳定性具有下列两种表现形式,
结构不稳定性
重组 DNA分子上某一区域发生缺失、重排、修饰,导致
其表观生物学功能的丧失
分配不稳定性
整个重组 DNA分子从受体细胞中逃逸( curing)
基因工程菌遗传不稳定性的表现与机制
工程菌遗传不稳定性的产生机制
受体细胞中的限制修饰系统对外源重组 DNA分子的降解
能量、物质的匮乏和外源基因表达产物的毒性诱导受体细胞
外源基因的高效表达严重干扰受体细胞正常的生长代谢
产生应激反应:关闭合成途径,启动降解程序
重组质粒在受体细胞分裂时的不均匀分配
这是重组质粒逃逸的基本原因
受体细胞中内源性的转座元件促进重组分子的缺失重排
基因工程菌遗传不稳定性的表现与机制
重组质粒的逃逸率
一部分细胞不再携带重组质粒,这些空载细胞数与总细胞数之比称为
当含有重组质粒的工程菌在非选择性条件下生长时,培养系统中
称为重组质粒的 宏观逃逸率 。重组质粒逃逸的原因有,
高温培养、表面活性剂( SDS),药物(利福平)、染料(
吖啶)促使重组质粒渗漏
受体细胞中的核酸酶降解重组质粒
重组质粒在受体细胞分裂时不均匀分配,细胞所含重组质粒
拷贝数的差异随着细胞分裂次数的增多而加剧
改善基因工程菌不稳定性的策略
改进载体受体系统
以增大质粒稳定性为目的的构建方法包括,
将 R1质粒上的 parB基因引入表达型载体中,其表达产物可以
选择性地杀死由于分配不均匀所产生的无质粒细胞
正确设置载体上的多克隆位点,禁止 DNA片段插在稳定区内
将受体细胞的致死性基因安装在载体上,同时构建条件致死
性的相应受体系统,如大肠杆菌的 ssb基因( DNA单链结合
蛋白编码基因
改善基因工程菌不稳定性的策略
施加选择压力
根据载体上的抗药性标记,向培养系统中添加相应的抗生素
药物和食品生产时禁止使用抗生素
根据载体上的营养缺陷型标记,向培养系统中添加相应的营
培养基复杂,成本较高
养组份
改善基因工程菌不稳定性的策略
控制目的基因的过量表达
使用可控型启动子控制目的基因的定时表达及表达程度
使用可控型复制子控制质粒的定时增殖或降低质粒的拷贝数
优化基因工程菌的培养工艺
培养基组成,限制培养基比丰富培养基更有利于稳定
培养温度,较低的培养温度有利于重组质粒的稳定
E 利用重组大肠杆菌生产人胰岛素
6 大肠杆菌基因工程
胰岛素的结构及其生物合成
人胰岛素的生产方法
重组人胰岛素的大肠杆菌工程菌的构建
胰岛素的结构及其生物合成
S
S
S
S
C
N
S S
B 肽( 30)
C 肽( 31)
A 肽( 21)
R
R
R
K
S
S
S
S
C
N
S S
N
C
高尔基体内的特异性肽酶
N C
信号肽 B 肽 C 肽 A 肽 信号肽酶
人胰岛素的生产方法
直接提取法制人胰岛素
迄今为止,有四种大规模生产人胰岛素的方法,
早期人的胰岛素是从人的胰脏中直接分离纯化的,由于原料
供应的限制,其产量远远不能满足日益增多的糖尿病人的临
床需求。
人胰岛素的生产方法
化学合成法制人胰岛素
根据人胰岛素 A链和 B链的序列,由单个氨基酸从头合成。这
条化学全合成的路线从技术上来说是能够做到的,但其生产
成本奇高,从而也限制了产品的广泛应用。
人胰岛素的生产方法
化学转型法制人胰岛素
猪的胰岛素可从原料丰富的猪胰脏中提取获得,而且猪胰岛素
与人胰岛素只在 B链的 C末端有一个氨基酸的差异,猪的为 Ala,人
的为 Thr,因此将猪胰岛素在体外酶促转化为人胰岛素不失为一种
选择。
上述思路的技术路线是:在 pH为 6-7的有机相中使胰蛋白酶催
化其逆反应,该酶在过量的苏氨酸叔丁酯的存在下,将猪胰岛素 B
链 C末端的丙氨酸交换下来,所形成的人胰岛素叔丁酯再用三氯乙
酸脱去叔丁酯基团,最终获得人胰岛素。该过程的总转化率为 60%
但工艺路线耗时,分离纯化操作复杂,产品的价格不菲。
人胰岛素的生产方法
基因工程法制人胰岛素
1982年,美国 Ely LiLi公司首先使用重组大肠杆菌生产人胰岛
素,成为世界上第一个上市的基因工程药物。 1987年,Novo公司
又推出了利用重组酵母菌生产人胰岛素的新工艺。
上述由基因工程菌合成的重组人胰岛素在体外胰岛素 受体结合
性能, 淋巴细胞和成纤维细胞的应答能力, 降血糖作用, 血浆药代
动力学 等指标上均与天然胰岛素没有任何区别,而且还具有 无免疫
原性, 注射吸收迅速等 优点,充分展示了基因工程在生物医药领域
中的巨大潜力。
重组人胰岛素的大肠杆菌工程菌的构建
A链和 B链分别表达法
基因工程菌的构建战略,tac tac
b-Gal b-Gal
A peptide B peptide
ori ori
Apr Apr Met Met
Met Met
M M
N C
M M
N C
化学合成 A链
和 B链的编码
序列
重组人胰岛素的大肠杆菌工程菌的构建
A链和 B链分别表达法
表达产物的后处理路线,
M M
N C
M M
N C
b-Gal b-Gal A B
CNBr 处理
N C
S
S
S
S
C
N
S S
N
C
N C N C N C
Cys 体外氧化和重折叠 分离纯化
重组人胰岛素的大肠杆菌工程菌的构建
A链和 B链分别表达法
生产技术的评价,
由于 A链和 B链上共存在六个半胱氨酸残基,体外二硫键的正
确配对率较低,通常只有 10% - 20%,因此采用这条工艺路线生
产的重组人胰岛素每克成本高达 100美元 以上。
为了进一步降低生产成本,美国 Ely LiLi公司随后又建立了第
二条生产重组人胰岛素的工艺路线。
重组人胰岛素的大肠杆菌工程菌的构建
人胰岛素原表达法
基因工程菌的构建战略,
tac
b-Gal
C peptide
ori
Apr
Met
Met
M M
N C
B peptide
A peptide
人胰岛素原的 cDNA 重组人胰岛素原
转化
分离纯化
重组人胰岛素的大肠杆菌工程菌的构建
人胰岛素原表达法
表达产物的后处理路线,
S
S
S
S
C
N
胰蛋白酶
C peptide
A peptide
B peptide
M
R
R
K
R
CNBr
R
S
S
S
S
C
N
N
C
S S
S S
R 羧肽酶 B
B链中第 22位上的 Arg和第 29
位上的 Lys由于良好折叠的原
因,对胰蛋白酶不敏感
重组人胰岛素的大肠杆菌工程菌的构建
人胰岛素原表达法
生产技术的评价,
在人胰岛素原表达工艺中,由于 C肽的存在,胰岛素原能形成
良好的空间构象,三对二硫键的正确配对率也相应提高,折叠率高
达 80%以上。虽然这条工艺路线并不比 AB链分别表达法更为简捷,
而且还要使用两种高纯度的酶制剂,但理想的折叠率在很大程度上
弥补了工艺繁琐的缺陷,使得每克最终产品的成本仅 50美元 。
目前美国 Ely LiLi公司采用此工艺年产 十几吨 的重组人胰岛素。
重组人胰岛素的大肠杆菌工程菌的构建
A链和 B链同时表达法
tac
b-Gal
ori
Apr
Met
Met
M M
N C
B peptide
A peptide
化学合成 AB链编码序列
重组人胰岛素
转化
分离纯化
CNBr 处理
特异性裂解 体外折叠
重组人胰岛素的大肠杆菌工程菌的构建
分泌型重组人胰岛素表达法
上述三种重组大肠杆菌的构建路线均采用胰岛素或胰岛素原编
码序列与大肠杆菌 b-半乳糖苷酶 基因拼接的方法,所产生的融合型
重组蛋白表达率高、稳定性强,但不能分泌,只要以包涵体的形式
存在于胞质中。一种能促进融合蛋白分泌的工程菌构建策略是将胰
岛素或胰岛素原编码序列与 b-內酰胺酶 基因拼接,b-內酰胺酶通常
能被大肠杆菌分泌到胞外。由此获得的工程菌同时具备了稳定高效
表达可分泌型融合蛋白的优良特性,为胰岛素的后续分离纯化工序
减轻了负担。