第九章 基因工程和基因组学
第一节 基因工程
(一)基因工程的概念
1,遗传工程
广义,细胞工程 ------如体细胞、原生质体的培养与杂交
细胞器工程 ------细胞核的移植,回交,克隆羊
染色体工程 ------整条染色体或染色体片断的切割或转移。
基因工程
狭义:基因工程,体外不经过有性繁殖,有目的地使 DNA发生重
组的技术体系。故又称重组 DNA技术。
2,克隆( clone)
n,无性繁殖系:无性繁殖系,遗传物质来源和组成完全相同。
v,获得无性繁殖系的过程-即获得某种特异 DNA片段,并大量
扩增的过程。
二, 基因工程的内容与步骤
机械或者 限制性内切酶 切割
基因组 DNA cDNA ? mRNA
DNA片段(包括某目的基因的片段)
将 DNA片段连接到 载体
?重组 DNA分子
导入到合适的受体细胞,重组 DNA分
子在受体细胞中增殖。
筛选出获得了重组 DNA分子的受体细胞
鉴定出带有目的基因片段的克
隆, 回收, 纯化, 分析该片段 。
转基因
Cos L Cos R
Bam H I Sau 3A
gDNA
(cDNA)
+
质粒 酶切
连接 转基因
λ
连接
体外装配
重组噬菌体感染 E.Coli
Cos L Cos R
重组 DNA分子
基因文库
cDNA文库
基因克隆
基因文库的构建
筛选
三、限制性内切酶
? 定义:限制性、内切酶
? 类型:
I 型,特异识别位点,但切割位点随机。需要 ATP、
Mg2+等。基因工程中无用,EcoB; EcoK
II 型, 特异识别位点和切割位点。只需 Mg2+。
识别位点:回文对称序列( palindrome)
粘性末端,EcoR I Hind III,5’突出
Not I Pst I 3’突出
平头末端,Sma I
EcoR I,
Hind III:
5’
3’
GAATTC
CTTAAG
GAATTC
CTTAAG
AATTC G
CTTAAG
AAGCTT AAGCTT
TTCGAA TTCGAA
AGCTT A
A TTCGA
5’
3’
5’
3’
5’
3’
3’
5’
3’
5’
3’
5’
3’
5’
Pst I
Sma I
CTGCAG CTGCAG
GACGTC GACGTC
G CTGCA
ACGTC G
5’
3’
5’
3’
5’
3’
5’
3’
3’
5’
3’
5’
3’
5’
3’
5’
CCCGGG CCCGGG
GGGCCC GGGCCC
GGG CCC
CCC GGG
四,载体( vector)
?类型,质粒(含粘粒)、病毒(噬菌体)、
YAC,BAC,PAC 等
?条件:
1,具有复制原点( ori),在宿主细胞中能自我复制并带动
外源 DNA复制,稳定保持。
2,具有多克隆位点( MCS- multiple cloning sites ),即
有多种限制酶切位点,各种位点是唯一的,且与载体的
复制原点和标记基因位点无关。
3,有可以作为重组 DNA分子筛选的标记基因。至少一个,
寄主没有这种基因。
4,容易从寄主中分离回收。
?常见的载体
(一)克隆载体
1,质粒( plasmid)
pBR312-缺点:拷贝数低
承载量小,3-4 Kb
pUC19 - a,本身较小,2.6- 2.7kb,
可插入 5-12Kb
b,高拷贝数,500
c,可以 LacZ 基因蓝白斑筛选(蓝斑不一定没有插
入,但白斑一定有插入)
IPTG?Lac Z表达 ?X-gal分解 ?蓝色
2,? 噬菌体 ( ? phage)
( 1) EcoR I 酶切 ?左,头,尾
右,复制、裂解。
中间:去除不影响繁殖、裂解等。
( 2)易操作、阳性克隆多
( 3)承载 15-23 kb
3,粘粒(柯斯质粒- cosmid)
( 1) 结构,? 噬菌体 cos+质粒 ori
?既 可以包装成噬菌体,又可以在细菌中大量复制。
( 2) 承载:~ 50 kb ?克隆真核生物的基因、作图。
Ori- 质粒复制原点,可以在细菌中扩增
SV40 Ori-噬菌体复制原点,可以在病毒中复制
cos-噬菌体包装
Neor-新潮霉素抗性基因
Ampr-氨苄霉素抗性基因
r
4,穿梭载体 ( shuttle vector)
( 1)定义:能在两种不同生物中 复制 的载体。
一种:原核生物( E.coli)
一种:真核生物 (酵母)
( 2)结构:
a,复制原点,ori --------------------------------- E.coli
ARS(自主复制序列) ------- 酵母( 2 ?)
b,选择标记:两种宿主不同的标记。
酵母,URA3(尿嘧啶合成基因)
细菌,ampr,Tcr
( 3)应用:
在细菌中克隆基因
在酵母中表达。
Tcr
5,YAC( Yeast Artificial Chromosome)
( 1)结构
? 来自酵母:
染色体着丝粒,CEN4
复制起始点,ARS1
选择基因,TRP-色氨酸合成基因
URA3- 尿嘧啶合成基因
Sup4( tRNAtyr)
? 来自嗜热四膜虫:
端粒,CEL
? 来自细菌:
复制起始点,Ori
选择基因,ampr
克隆位点,EcoRI ( Sup4)
填充序列,His 3
Ampr
白 ?赭
( 2)特点
– 承载大,1000kb
– 嵌合率高
– 插入片段不稳定
– 生长慢
– 操纵难
( 3)应用:
– 适合高等生物大基因组的克隆、作图
6,BAC( Bacterial Artificial Chromosome)
( 1)结构
– 最小的 F 因子(因此是质粒),7Kb
– 复制起始,Ori
– 控制拷贝数基因,repE
– 质粒分配,parE,parA,parB
– 选择性基因,Cmr
– 多克隆位点
( 2)特点
– 低拷贝数
– 可以容纳 300 Kb 的插入片段
– 可以蓝白选择
– 由于是一种质粒,所有容易操作
– 稳定
– 嵌合性低
( 3) 应用:
– 适合高度生物大基因组的克隆、作图
( 二 ) 转基因载体
1,Ti质粒:
根癌农杆菌 ( Agrobacterium tumefaciens) 中的致瘤质粒
( tumor-inducing,Ti) 。
结构:
( 1) T-DNA:左右边界之间的 DNA序列。
a,LB和 RB正向不完全重复,可以携带其间的 DNA插入到
植物基因组中去
b,致瘤基因-( CTK 基因)失去分化能力 ?disarm
c,冠瘿碱合成基因:其启动子 nos 可用。
( 2) Vir区:控制 T-DNA 转移、整合
感染柳
树产生
冠缨瘤
2,Ri 质粒:
发根农杆菌( Agrobacterium rhizogenes)中的质粒,可以诱发假根发
生。
五, 基因的分离与鉴定
(一)基因文库中分离
1,文库种类:
( 1) 核基因组文库:
( 2) 染色体文库:单条染色体 ?激光微切割 ?连接载体 ?文库
( 3) cDNA文库,mRNA
RNA-cDNA
逆转录酶
RNaseH
3’ AAAAAAA
5’ TTTTTTTT
5’
3’
DNA聚合酶
DNA连接酶
cDNA( ds)
3’ AAAAAAA
5’ TTTTTTTT
3’ AAAAAAA
5’ TTTTTTTT
3’ AAAAAAA
5’ TTTTTTTT
3’ AAAAAAA
5’ TTTTTTTT
5’
3’
5’
3’
5’
3’
5’
3’
2,文库的筛选方法
( 1)菌落杂交
( 2)噬菌斑杂交
( 3)其它方法(如 PCR 法基因芯片等)。
关键:杂交用的 探针:
DNA(荧光、放射性同位素标记)
蛋白质抗体
蛋白质
抗体 *
基因芯片 (Gene Chip,DNA Chip),
又称 DNA微阵列 (DNA Micorarray),是指按照预定
位置在固相载体(玻璃片、硅片、聚丙烯膜、硝酸纤维素
膜、尼龙膜等)上很小面积内固定千万个核酸分子所组成
的微点阵阵列。在一定条件下,这些核酸分子可以与来自
样品的序列互补的核酸片段杂交。如果把样品中的核酸片
段进行标记,在专用的芯片阅读仪上就可以检测到杂交信
号。
– 特点:无可比拟的高效、快速和多参量。
– 应用:基因克隆、基因表达分析、基因诊断等。
3,阳性克隆的鉴定
( 1)限制性酶图谱:
将阳性克隆 DNA回收,用不同的限制
性内切酶酶切、电泳,再根据电泳片段拼
接整个 DNA,并标示酶切位点。然后 与
分子标记(如 RFLP)对照。
分析方法:
单酶切,Not I ? 12.2 2.8
10.2 2.0 2.8
双酶切找共有带,Not I + Sal I ?2.8 kb 与 Not I 单酶切相同,说明
Sal I 是在 12.2 内有酶切点
另一个单酶切,产生 10.2 + 4.8
Sal I Not I
( 2) 核酸分子杂交:
a,Southern 杂交 —— 检测某段特征 DNA 序列:
DNA探针与 DNA的杂交。
b,Northern杂交 —— 检测基因 RNA表达水平
DNA探针与 RNA 的杂交。
( 3)核酸序列测定:
Sanger( 1977)双脱氧终止法:
dNTP( 100)+ ddNTP( 1)
Gilbert( 1977)化学法:
( 4)核酸序列分析:
利用计算机软件、互联网数据库以及搜索引擎,结合
实验对基因的功能进行预测和验证。
(二)聚合酶链式反应( PCR)扩增基因
PCR,Polymerase Chain Reaction -聚合酶链式反应
Taq 酶:嗜热杆菌中提取,72?C活性最高,94 ?C半衰
期达到近半小时。

94 ?C 变性
35~65 ?C 复性

72 ?C 延伸
n 个循环扩增 2n
常见基于 PCR的分子标记:
RAPD,Random Amplified Polymorphism DNA
AFLP,Amplified Fragment Length Polymorphism
SSR,Simple Sequence Repeats DNA
(三)人工合成基因
SOE-PCR:
SOE,Splicing by using overlapped extension,重叠延伸
拼接。
20 / 100
六、基因工程的应用
(一)工业:
生产胰岛素、表皮
生长因子、生长素、干
扰素、基因工程疫苗。
(二)植物基因工程:
Requirements:
– 可再生植株的植物 组织培养 体系
– 带适当启动子的目的基因:
启动子,CaMV 35S
目的基因:抗除草剂基因( Bar)、抗虫基因
( Bt),作物品质、产量、果实成熟控
制基因等( ACC)、生物反应器
– 带有可选择标记基因的载体:
标记基因:抗生素抗性基因等
载体,Ti,Ri质粒等。
Methods:
( 1)生物学方法:农杆菌介导
( 2)物理方法,DNA直接吸收。
—电穿孔法:( Electroporation)
—去膜稳定性法 ( PEG,干燥)
—微注射法( Microinjection)
—基因枪法( Particle bombardment)
载有外源 DNA
的金粉颗粒
抽真空
(三)转基因动物
发展缓慢。
非病毒介导:显微注射、电穿孔
病毒介导 电穿孔等
(四)基因治疗
概念:将某种遗传物质转移到患者细胞内,使其在体
内发挥作用,以达到治疗疾病目的的方法。
分类,1、基因矫正 2、基因置换
3、基因增补 4、基因失活
第二节 基因组学
一、概念
1,基因组( genome):是指一个细胞全部的 DNA分
子,包括核基因组和细胞器基因组。
2,基因组学( genomics):
( 1) global:所有基因及其产物( RNA和蛋白质)
( 2) of high throughput:高通量
( 3) dynamic:相互作用、代谢、生理等。
3,基因组学研究内容:
( 1)构建基因组的遗传图谱( genetic map)
( 2)构建基因组的物理图谱( physical map)
( 3)构建基因组 DNA全序列( DNA sequencing)
( 4)基因组的进化
( 5)构建基因组的转录图谱( Transcrptome)
( 6)基因组功能分析
( 7)功能基因组
( 8)代谢组
…………
二、遗传图谱的构建
1,遗传图谱:生物的遗传性状或标记的连锁图,并定位到
染色体上。
性状标记:形态、生理等表型。
分子标记:蛋白质标记(同工酶)
DNA标记
2,DNA标记的类型:
( 1) RFLP( Restriction Fragment Length Polymorphism)
数目有限,不够用
A B
EcoRI酶 切
电泳
转膜、杂交
GAATTC GAAATCCTTAAG CT TTAGA B
EcoRI
G
CTTAA
AATTC
G
GAATTC
CTTAAG
A B
理论上可以检测单个碱基的差异
衍生 ?AFLP
( 2) SSLP( Simple Sequence Length Polymorphism)
a,VNTR ………… Variable Number of Tandem Repeat
Minisatellite:主要分布着丝粒、端粒附近
(ATGGGTCTA)8
b,STR ……………Simple Tandem Repeat
Microsatellite:分布整个染色体
(AT)8, (AT)15,(AT)20 ……
( 3) SNP( Simple Nucleotide Polymorphism)
酶切位点- RFLP
不在酶切位点
编码区
非编码区
3,遗传图谱的构建:
人类,STR、家系分析法
植物:
( 1)亲本选择:差异大、子代可以稳定遗传
例如,陆地棉 × 海岛棉
( 2)亲本的标记差异筛选
( 3)作图群体构建以及
分子标记检测。
( 4)连锁分析:两点测验、三点测验等。
(软件,MAPMAKER)
( 5)遗传标记的染色体定位:
a,非整倍体
b,标记基因
三, 物理图谱的构建
1,什么是物理图谱?
1) 建立在分子杂交和 PCR分析基础之上
2) 限制性做图
3) 原位杂交- FISH
4) STC,sequence tag connector 序列标签连接
5) DNA测序
2,为什么要建物理图谱?
1)遗传图谱分辨率不高:
玉米, 4000 kb / cM,棉花, 600 kb/cM,水稻, 120 kb / cM
拟南芥,120kb/cM,人类,599 kb/cM
2)遗传图谱精确性不高
重组热点
( recombinant hotspot)
gDNA
3,怎样建物理图谱?
( 1)限制性酶图谱,同上
B
A CBAC contig
( 2)荧光原位杂交( FISH )
有丝分裂制片
DNA变性
荧光标记探针杂交
( 3)序列标签位点( STS-Sequence Tag site)
I 条件:
–序列已知
–单个位点
II 类型:
–特异 DNA序列:
– DNA片段:
表达序列标签( EST)
SSLP
DNA随机片段
辐射杂交系
克隆 DNA片段 (如 BAC克隆 )
EST- expressed Sequence Tag,cDNA文库随机测序
( 4) DNA序列测定
,Top-down”,
建立一个饱和遗传图谱 ?物理图谱 ?测序
,Bottom up”………… 鸟枪法( shotgun):
构建随机文库 ?连续重叠群( contigs) ?测序
基因 1
基因 2
标记 3
标记 2
标记 1
1,遗传图谱 2,物理图谱
位点,基因(性状)分子标记 位点,染色体,DNA片断、序列
距离,cM 距离,长度,kb
Rice Chromosome 4 maps
四、基因组图谱的应用
? 基因定位:
? 基因组 比较分析,
? 标记辅助选择 (MAS):直接对基因型进行选择。
? 基因的克隆与分离:
图位克隆-染色体步移、染色体着陆
? 基因诊断:
利用现代分子生物学和分子遗传学的技术方法,直
接探测基因结构及其表达水平,从而对疾病作出诊断的方
法。 分为 DNA诊断和 RNA诊断两类。
( 1)限制性图 ( 2) RFLP
( 3)等位基因特异寡核苷酸探针杂交法
( 4) PCR ( 5)基因测序
( 6)基因芯片
五, 后基因组学
又称作功能基因组学,基因组图谱构建,尤其是全序列
测定完成之后,研究全基因组的 表达,基因功能、基因之间
相互关系、基因表达调控机制。对基因组序列的注解。
DNA序列 基因产物、功能、细胞定位等
功能预测
功能鉴定
(一)基因表达产物:
1,transcriptome (转录组),
全长 cDNA 序列基因表达,cDNA芯片
2,proteome (蛋白质组), all proteins of a cell
研究蛋白质表达种类、数量、蛋白质修饰、蛋
白空间结构、蛋白质相互作用等。
– 表达蛋白组学:
( 1)蛋白质芯片
( 2) 二维电泳+质谱分析
? 2-D 电泳- 展示蛋白质
第一维:等电聚焦( IEF)
第二维,SDS- PAGE
? 质谱分析-鉴定蛋白质
s a m p l e
g e l r o d r e b u f f e r e d
i n S D S b u f f e r
P r i n c i p l e a c c o r d i n g t o P, H, O 扚 a r r e l l a n d J, K l o s e ( 1 9 7 5 )
p H 1 0
p H 1 0
p H 3
p H 3
I s o e l e c t r i c
F o c u s i n g i n p r e s e n c e
o f u r e a,N o n i d e t N P - 4 0
i n v e r t i c a l g e l r o d
F i r s t D i m e n s i o n,
S e c o n d D i m e n s i o n,
S D S P o ly a c r y l a m id e
G e l E l e c t r o p h o r e s i s
i n d is c o n t i n u o u s g r a d i e n t g e l
Se p a ra t i o n a cc, t o
I s o e l e ct ri c Poi n t s (ch a rg e )
Se p a ra t i o n a cc, t o
Mo l e cu l a r W e i g h t ( ma ss)
– 蛋白质相互作用:
酵母双杂交系统:
酿酒酵母半乳糖苷酶基因转录
激活因子 GAL4:
N-端 1~147- DNA结合结构域
C-端 768~881-转录激活结构域
模块式结构:功能独立、可以分开
1
2
靶蛋白基因 未知蛋白
cDNA 文库
LacZ
(二)基因的功能
基因敲除( knockout):突变体库
转基因:功能验证
(三)基因调控
蛋白质- DNA相互作用
基因芯片
六、生物信息学及其在分子生物学中的应用
? 概念:没有一个标准的定义,广义上,它是一个综合
利用计算机科学、数学、统计学的方法解决生
物学问题的技术体系。它包括对重要生物学数
据的采集、归档、处置、管理、搜寻、分析、
解释和展示。以便回答:新发现基因的作用,
及其在复杂生命机制中的位置,它允许人们有
效地挖掘、收获、查询信息。
? 应用:
1,通过与已知功能的蛋白质结构进行比较,预测新
蛋白质的功能
― Structure prediction
― Structural genomics(蛋白质的结构)
2,基因的鉴定与注解:从 DNA序列预测它编码的蛋
白质的功能
3,比较基因组分析:基因组内和基因组间比较预测
蛋白质的功能、保守序列:进化、基因的最少必
要序列
4,全长 cDNA:以其它物种 cDNA,来发现新基因。
5,从 SNPs设计个性化药物。
Genomes,genes,transcriptomes,proteomes
QTLDisease gene
STS SNPRFLP SSRGenetic map
Physical map
Gene structure
Transcripts
Proteins
Clone
:
Contigassembly
unigene
ESTs
Gene prediction
Gene Expression
Microarray (GEMs)
Sequencing,sequence assembly
1 2 3 4
1 2 3 1 2 4
Protein complex
GATCGTCAGATCAGCAT CAGCATCAGCGACT CAGCATCATATCATCAGCAC GATCACGACGACTACTA CGACTACAGSequence contigs
EST clustering
Protein attributes
Molecular weight
Cellular location
Function
Assembly
Interaction