第二章 基因和基因组及基因工程的概念
第一节 基因的概念
第二节 基因组
第三节 基因工程的定义和研究内容
第四节 基因工程的发展史
第一节 基因的概念
一、基因与“遗传因子”
二、基因与染色体
三、基因与蛋白质
四、基因与 DNA
五、基因密码的破译
六、基因的概念
七、基因的新概念
一、基因与“遗传因子”
? 对遗传物质基础的认识有个发展过程,孟德尔
( G.Menodel) 在 1857~ 1864年以豌豆为材料
进行杂交实验的研究中,提出“遗传因子”决
定和控制着生物体的各种性状。
? 1909年丹麦生物学家 W.Johannsen为了强调, 遗
传因子, 与生命的关系,他根据希腊, 给予生
命, 之义的词, gene”( 基因 ) 创造性地用
,gene”这个术语来代替, 遗传因子, 。 基因这
个词当时被用来描述遗传性状, 但对基因的物
质概念还未能认识, 只是遗传的一个符号 。
孟德尔的豌豆杂交试验
遗传因子是成对的,一个来自父本,一个来自母本,形
成配体时彼此分开,在性细胞中是成单的,杂交子一代
各自保持独立和纯一状态,形成配子时又彼此分开,互
不混杂,完整地传给后代,雌雄配
子结合有等同随机结合的机会。
?
? 圆形种子+皱形种子
杂交第一代 (均为圆形 )
回交
圆形豆 皱形豆
5474粒 1850粒
3, 1
? 黄色图形+绿色皱形
杂交第一代 (均为黄色圆形 )
回交
黄色圆形豆 黄色皱形豆 绿色圆形豆 绿色皱形豆
315粒 121粒 108粒 32粒
9,,, 3 3 1
二、基因与染色体
? 1910年~ 1926年,美国的 摩尔根( T.H.Morgan)
选用果蝇做研究材料,发现了基因连锁和交换
现象,创立了遗传的染色体理论
( Chromosomol theory of inheritance),绘制
了基因连锁 图,接受了孟德尔的遗传原理,指出
遗传物质必须由某种独立的要素组成,即遗传因
子或叫做基因。从而证明了基因是位于染色体
上呈直线按顺序排列的遗传单位,基因是携带
遗传信息的结构单位,又是控制遗传性状的功
能单位 。
摩尔根果蝇杂交试验
? 有 4对染色体,一对小粒状,2对 V形,一对呈棒
状 XX或 XY(性染色体)
X1X2(红眼) +XWY(白眼)
(野生型) (突变型)
杂交子一代(雌雄均为红眼)
X1XW,X1Y, X2XW,X2Y
X1X1,X1Y,XWX1,XWY,X2X1,X2Y,XWX2,XWY
?为红眼雄性及白眼雄性
三、基因与蛋白质
? 1941年 G.W.Beadle和 E.L.Tatum应用 X射
线诱导链孢霉菌( Newospore crassa)在
DNA损伤修复后,产生了大量营养缺陷性
突变体,提出了“一个基因一种酶”学说,
后来又修正为“一个基因一种蛋白质”
的学说,或“一个基因一种多肽链”学说。
四、基因与 DNA
? 1928年美国 O.T.Avery首次证明了控制遗
传特性的物质是 DNA,而不是蛋白质,染
色体上的基因为 DNA分子。
? 1953年 J.watson和 F.Crick根据碱基配对规
律和 DNA分子的 X射线衍射图谱等实验,
提出了 DNA分子的双螺旋结构。
? 1958年证明了 DNA半保留复制和 DNA
RNA 蛋白质合成的中心法则( 如图 )。
遗传中心法则
五、基因密码的破译
? 1961年 F.Crick,S.Brenner,M.W.Nirenberg,
H.G.Khorana等确立了每三个核苷酸可作为决
定一个氨基酸的 密码子 。
? 1964年 64种三联密码子全部被破译公布。 64种
密码子中有 61个密码子可用于编码 20种氨基酸,
有 3个密码子为终止信号,只表示链的终止,不
表达任何氨基酸。其中 AUG为启始密码子,并
具有通用性、偏爱性和 简并性 。
遗传密码的兼并性
六、基因的概念
? 按照分子生物学理论,基因的概念应当是指编
码有功能蛋白质多肽链或 RNA分子所必需的全
部核酸序列(即 DNA序列)。根据这个概念,
一个基因不仅含编码蛋白质肽链或 RNA分子的
核酸序列,还包括保证转录所必需的非编码的
调控序列即位于编码区上游 5’端的启动子非编
码序列、内含子( intron)和位于编码区下游 3’
端的终止子非编码序列。编码区是发挥基因功
能的结构基因(或功能基因),而起调控、启
动和终止作用的非编码区属于调控基因。
七、基因的新概念
1、移动基因
2、断裂基因( split gene)
3、重叠基因
4、假基因
5、重复序列及重复基因
1、移动基因
? 移动基因( movable gene)又叫转位因子
( transposable elements),由于它可以在染色体
基因组上移动,甚至可在不同染色体间跃迁,
故又称跳跃基因( jumping gene),这种基因是
J.A.Shapiro在研究大肠杆菌高效突变时发现的。
有三种类型,1.插入序列( insertion sequences,
简称 IS),其长度为数百个到数千个碱基对之
间(如 图 1-1) 。 2.转位子( Tn),即两侧的 IS
和一个中心序列(带有遗传信息) 3.噬菌体 Mu
和 D108,其转位作用如 图 1-2。
2、断裂基因( split gene)
? 在真核细胞中的核苷酸序列中间插入与
氨基酸编码无关的 DNA间隔区段,使一
个有功能的结构基因分隔成不连续的若
干区段,将这种编码序列不连续,有间
隔区段的 DNA片断称为断裂基因。这种
非编码间隔区段 DNA称间隔子(内含
子),有转录和编码功能的编码序列称
表达子。原核细胞无内含子。其二者
mRNA剪辑作用如 图 1-3,1-4,1-5
3、重叠基因
? 不同基因的核苷酸序列有时为相邻两个
基因共用,将核苷酸彼此重叠的两个基
因称为重叠基因( overlapping genes),在
??174噬菌体有两种类型的重叠基因( 图
1-6)。
4、假基因
? 在珠蛋白基因簇( gene cluster)各片断核
苷酸序列分析时发现,除了有正常的功
能基因之外,还有功能失活的特殊序列
片断,它不能行使表达功能。该类无表
达功能的畸变核苷酸基因序列片断,称
为假基因。其产生原因如 图 1-7,1-8
5、重复序列及重复基因
几乎所有的真核细胞(酵母除外)的基因组
DNA中都具有重复序列( repeated sequence),
它无转位移动能力,因此它区别于转位作用的
IR( inverted repeat)。 IR是指序列的重复性。
但无基因序列的交叉重叠性,故不同于重叠基
因序列。重复序列可分为四种类型,
? (1)不重复序列,是唯一的序列,只有一个拷贝。
? (2)低度重复序列,一般有 1-10个拷贝。
? (3)中度重复序列,有数十至数万( 105)拷贝。
如 图 1-9,1-10
? (4)高度重复序列 拷贝数可达 106以上,包括 卫星
DNA、高丰度 SINE家族的 Alu序列 。
第二节 基因组
,基因组”是表示某物种单倍体的总 DNA,对
于二倍体高等生物其配子的 DNA总和即为一组基因
组。不同生物基因组数目不同,如表
研究得较多的为以下三类基因组,
? 一,病毒基因组
? 二,细菌基因组
? 三,真核生物基因组
第三节 基因工程的定义和研究内容
基因工程的定义 通常是指
在体外把核酸分子 ( 基因 )
组合到特定的载体上 ( 病
毒, 质粒, 噬菌体等 ) 并
使之进入 ( 或导入 ) 到原
来没有这类分子的宿主体
内, 能使基因在宿主内繁
殖或表达生物活性物质 。
基因工程的核心内容是重
组 DNA技术, 还包括体外
DNA突变, 体内基因操作
以及基因的化学合成等 。
第四节 基因工程的发展史
? 一,四大里程碑
? 二,三大技术发明
? 三,基因工程的诞生
病毒基因组
? 特点,1.结构简单,无细胞结构,基因组为 DNA或 RNA
组成,有双链 /单链,环状 /线状。 2.有调控元件和转录
元件组成,转录元件可转录成为多顺反子 mRNA。 3.有
重叠基因。 4.逆转录病毒( RV)可使 RNA变 cDNA其结
构如图,具 U3RU5的长末端重复序列( LTR),具随
机整和能力,可用作病毒载体。
细菌基因组
? 约有三千个基因,无内含
子,为双链 DNA,但无核
仁、核膜,多为单拷贝,
无重叠基因,有多种功能
调控区,有复制起始区、
终止区、转录起始区,终
止区常有反向重复序列。
另外有质粒存在,质粒可
作为载体。
真核生物基因组
? 特点:大而复杂,为双倍体,有低中高重复序
列,多为断裂基因,基因组中非编码区多于编
码区(占 90%),大多于蛋白质结合形成染色
体,DNA占 35%,RNA占 5%,其余为蛋白质
(组蛋白或非组蛋白)
? 与 C值矛盾:一般高等生物的全部 DNA量(称
C值)均大于低等生物,但某些植物或两栖动
物的 C值比人高出几十倍,这种与进化复杂性
不一致的 C值反常现象称为 C值矛盾。
? 类型
? 多基因家族
四大里程碑
1,遗传物质的明确 ——DNA
2,DNA双螺旋结构理论(半保留复制及其
中心法则)
3,基因遗传密码子的破译
4,基因转译载体的发现
三大技术发明
1,工具酶的发明:内切酶、合成酶、连接
酶
2,基因合成和测序(合成仪、测序仪)
3,PCR技术( PCR扩增仪)
基因工程的诞生
1972年是基因工程的诞生之年。美国斯坦福
大学 P.Berg 将 SV40的 DNA导入噬菌体载体
在大肠杆菌中获表达。 S.Cohen等人将抗四
环素、新霉素基因的质粒转化大肠杆菌,获
得抗四环素,抗新霉素重组菌落,从而揭开
基因工程的序幕。
类型
1,单拷贝序列:人类约占 60%~65%
2,中度重复序列:长短 300~700bp,重复次数达
105。通常为 Alu,KpnⅠ, Hinf,rRNA、
tRNA、组蛋白基因等。
3,高度重复序列,
– 卫星 DNA及微卫星 DNA
– 反向重复序列:人类约占 5%,长度 300bp在复性
时,若有间隔序列,可形成发夹结构,若无间隔
序列,可形成回文结构,可能与复制、转录调控
有关。
多基因家族
? 指来源相同,结构相似,功能相关的基
因在染色体上成串存在,形成多基因家
族。如 rRNA,tRNA、组蛋白基因等为
成串的,干扰素、珠蛋白、生长激素等
为分散的。
卫星 DNA
? 卫星 DNA又称随体 DNA,由 CsCl
超速离心后,分散在主峰旁,形
似卫星分布而称之。一般 5-10bp短
序列,人类为 171bp,保护和稳定
染色体。
? 近来又发现微卫星 DNA,又称简
单重复序列,一般由 1-6bp的串联
重复单位组成,有 2bp,5bp,6-
7bp不等,以 2bp为常见。人类基
因组中 2bp( ≥14)的重复序列呈
高度多态性。采用限制性长度多
态性( RFLP)分析,可用于基因
连锁的遗传标记,广泛用于诊断。
第一节 基因的概念
第二节 基因组
第三节 基因工程的定义和研究内容
第四节 基因工程的发展史
第一节 基因的概念
一、基因与“遗传因子”
二、基因与染色体
三、基因与蛋白质
四、基因与 DNA
五、基因密码的破译
六、基因的概念
七、基因的新概念
一、基因与“遗传因子”
? 对遗传物质基础的认识有个发展过程,孟德尔
( G.Menodel) 在 1857~ 1864年以豌豆为材料
进行杂交实验的研究中,提出“遗传因子”决
定和控制着生物体的各种性状。
? 1909年丹麦生物学家 W.Johannsen为了强调, 遗
传因子, 与生命的关系,他根据希腊, 给予生
命, 之义的词, gene”( 基因 ) 创造性地用
,gene”这个术语来代替, 遗传因子, 。 基因这
个词当时被用来描述遗传性状, 但对基因的物
质概念还未能认识, 只是遗传的一个符号 。
孟德尔的豌豆杂交试验
遗传因子是成对的,一个来自父本,一个来自母本,形
成配体时彼此分开,在性细胞中是成单的,杂交子一代
各自保持独立和纯一状态,形成配子时又彼此分开,互
不混杂,完整地传给后代,雌雄配
子结合有等同随机结合的机会。
?
? 圆形种子+皱形种子
杂交第一代 (均为圆形 )
回交
圆形豆 皱形豆
5474粒 1850粒
3, 1
? 黄色图形+绿色皱形
杂交第一代 (均为黄色圆形 )
回交
黄色圆形豆 黄色皱形豆 绿色圆形豆 绿色皱形豆
315粒 121粒 108粒 32粒
9,,, 3 3 1
二、基因与染色体
? 1910年~ 1926年,美国的 摩尔根( T.H.Morgan)
选用果蝇做研究材料,发现了基因连锁和交换
现象,创立了遗传的染色体理论
( Chromosomol theory of inheritance),绘制
了基因连锁 图,接受了孟德尔的遗传原理,指出
遗传物质必须由某种独立的要素组成,即遗传因
子或叫做基因。从而证明了基因是位于染色体
上呈直线按顺序排列的遗传单位,基因是携带
遗传信息的结构单位,又是控制遗传性状的功
能单位 。
摩尔根果蝇杂交试验
? 有 4对染色体,一对小粒状,2对 V形,一对呈棒
状 XX或 XY(性染色体)
X1X2(红眼) +XWY(白眼)
(野生型) (突变型)
杂交子一代(雌雄均为红眼)
X1XW,X1Y, X2XW,X2Y
X1X1,X1Y,XWX1,XWY,X2X1,X2Y,XWX2,XWY
?为红眼雄性及白眼雄性
三、基因与蛋白质
? 1941年 G.W.Beadle和 E.L.Tatum应用 X射
线诱导链孢霉菌( Newospore crassa)在
DNA损伤修复后,产生了大量营养缺陷性
突变体,提出了“一个基因一种酶”学说,
后来又修正为“一个基因一种蛋白质”
的学说,或“一个基因一种多肽链”学说。
四、基因与 DNA
? 1928年美国 O.T.Avery首次证明了控制遗
传特性的物质是 DNA,而不是蛋白质,染
色体上的基因为 DNA分子。
? 1953年 J.watson和 F.Crick根据碱基配对规
律和 DNA分子的 X射线衍射图谱等实验,
提出了 DNA分子的双螺旋结构。
? 1958年证明了 DNA半保留复制和 DNA
RNA 蛋白质合成的中心法则( 如图 )。
遗传中心法则
五、基因密码的破译
? 1961年 F.Crick,S.Brenner,M.W.Nirenberg,
H.G.Khorana等确立了每三个核苷酸可作为决
定一个氨基酸的 密码子 。
? 1964年 64种三联密码子全部被破译公布。 64种
密码子中有 61个密码子可用于编码 20种氨基酸,
有 3个密码子为终止信号,只表示链的终止,不
表达任何氨基酸。其中 AUG为启始密码子,并
具有通用性、偏爱性和 简并性 。
遗传密码的兼并性
六、基因的概念
? 按照分子生物学理论,基因的概念应当是指编
码有功能蛋白质多肽链或 RNA分子所必需的全
部核酸序列(即 DNA序列)。根据这个概念,
一个基因不仅含编码蛋白质肽链或 RNA分子的
核酸序列,还包括保证转录所必需的非编码的
调控序列即位于编码区上游 5’端的启动子非编
码序列、内含子( intron)和位于编码区下游 3’
端的终止子非编码序列。编码区是发挥基因功
能的结构基因(或功能基因),而起调控、启
动和终止作用的非编码区属于调控基因。
七、基因的新概念
1、移动基因
2、断裂基因( split gene)
3、重叠基因
4、假基因
5、重复序列及重复基因
1、移动基因
? 移动基因( movable gene)又叫转位因子
( transposable elements),由于它可以在染色体
基因组上移动,甚至可在不同染色体间跃迁,
故又称跳跃基因( jumping gene),这种基因是
J.A.Shapiro在研究大肠杆菌高效突变时发现的。
有三种类型,1.插入序列( insertion sequences,
简称 IS),其长度为数百个到数千个碱基对之
间(如 图 1-1) 。 2.转位子( Tn),即两侧的 IS
和一个中心序列(带有遗传信息) 3.噬菌体 Mu
和 D108,其转位作用如 图 1-2。
2、断裂基因( split gene)
? 在真核细胞中的核苷酸序列中间插入与
氨基酸编码无关的 DNA间隔区段,使一
个有功能的结构基因分隔成不连续的若
干区段,将这种编码序列不连续,有间
隔区段的 DNA片断称为断裂基因。这种
非编码间隔区段 DNA称间隔子(内含
子),有转录和编码功能的编码序列称
表达子。原核细胞无内含子。其二者
mRNA剪辑作用如 图 1-3,1-4,1-5
3、重叠基因
? 不同基因的核苷酸序列有时为相邻两个
基因共用,将核苷酸彼此重叠的两个基
因称为重叠基因( overlapping genes),在
??174噬菌体有两种类型的重叠基因( 图
1-6)。
4、假基因
? 在珠蛋白基因簇( gene cluster)各片断核
苷酸序列分析时发现,除了有正常的功
能基因之外,还有功能失活的特殊序列
片断,它不能行使表达功能。该类无表
达功能的畸变核苷酸基因序列片断,称
为假基因。其产生原因如 图 1-7,1-8
5、重复序列及重复基因
几乎所有的真核细胞(酵母除外)的基因组
DNA中都具有重复序列( repeated sequence),
它无转位移动能力,因此它区别于转位作用的
IR( inverted repeat)。 IR是指序列的重复性。
但无基因序列的交叉重叠性,故不同于重叠基
因序列。重复序列可分为四种类型,
? (1)不重复序列,是唯一的序列,只有一个拷贝。
? (2)低度重复序列,一般有 1-10个拷贝。
? (3)中度重复序列,有数十至数万( 105)拷贝。
如 图 1-9,1-10
? (4)高度重复序列 拷贝数可达 106以上,包括 卫星
DNA、高丰度 SINE家族的 Alu序列 。
第二节 基因组
,基因组”是表示某物种单倍体的总 DNA,对
于二倍体高等生物其配子的 DNA总和即为一组基因
组。不同生物基因组数目不同,如表
研究得较多的为以下三类基因组,
? 一,病毒基因组
? 二,细菌基因组
? 三,真核生物基因组
第三节 基因工程的定义和研究内容
基因工程的定义 通常是指
在体外把核酸分子 ( 基因 )
组合到特定的载体上 ( 病
毒, 质粒, 噬菌体等 ) 并
使之进入 ( 或导入 ) 到原
来没有这类分子的宿主体
内, 能使基因在宿主内繁
殖或表达生物活性物质 。
基因工程的核心内容是重
组 DNA技术, 还包括体外
DNA突变, 体内基因操作
以及基因的化学合成等 。
第四节 基因工程的发展史
? 一,四大里程碑
? 二,三大技术发明
? 三,基因工程的诞生
病毒基因组
? 特点,1.结构简单,无细胞结构,基因组为 DNA或 RNA
组成,有双链 /单链,环状 /线状。 2.有调控元件和转录
元件组成,转录元件可转录成为多顺反子 mRNA。 3.有
重叠基因。 4.逆转录病毒( RV)可使 RNA变 cDNA其结
构如图,具 U3RU5的长末端重复序列( LTR),具随
机整和能力,可用作病毒载体。
细菌基因组
? 约有三千个基因,无内含
子,为双链 DNA,但无核
仁、核膜,多为单拷贝,
无重叠基因,有多种功能
调控区,有复制起始区、
终止区、转录起始区,终
止区常有反向重复序列。
另外有质粒存在,质粒可
作为载体。
真核生物基因组
? 特点:大而复杂,为双倍体,有低中高重复序
列,多为断裂基因,基因组中非编码区多于编
码区(占 90%),大多于蛋白质结合形成染色
体,DNA占 35%,RNA占 5%,其余为蛋白质
(组蛋白或非组蛋白)
? 与 C值矛盾:一般高等生物的全部 DNA量(称
C值)均大于低等生物,但某些植物或两栖动
物的 C值比人高出几十倍,这种与进化复杂性
不一致的 C值反常现象称为 C值矛盾。
? 类型
? 多基因家族
四大里程碑
1,遗传物质的明确 ——DNA
2,DNA双螺旋结构理论(半保留复制及其
中心法则)
3,基因遗传密码子的破译
4,基因转译载体的发现
三大技术发明
1,工具酶的发明:内切酶、合成酶、连接
酶
2,基因合成和测序(合成仪、测序仪)
3,PCR技术( PCR扩增仪)
基因工程的诞生
1972年是基因工程的诞生之年。美国斯坦福
大学 P.Berg 将 SV40的 DNA导入噬菌体载体
在大肠杆菌中获表达。 S.Cohen等人将抗四
环素、新霉素基因的质粒转化大肠杆菌,获
得抗四环素,抗新霉素重组菌落,从而揭开
基因工程的序幕。
类型
1,单拷贝序列:人类约占 60%~65%
2,中度重复序列:长短 300~700bp,重复次数达
105。通常为 Alu,KpnⅠ, Hinf,rRNA、
tRNA、组蛋白基因等。
3,高度重复序列,
– 卫星 DNA及微卫星 DNA
– 反向重复序列:人类约占 5%,长度 300bp在复性
时,若有间隔序列,可形成发夹结构,若无间隔
序列,可形成回文结构,可能与复制、转录调控
有关。
多基因家族
? 指来源相同,结构相似,功能相关的基
因在染色体上成串存在,形成多基因家
族。如 rRNA,tRNA、组蛋白基因等为
成串的,干扰素、珠蛋白、生长激素等
为分散的。
卫星 DNA
? 卫星 DNA又称随体 DNA,由 CsCl
超速离心后,分散在主峰旁,形
似卫星分布而称之。一般 5-10bp短
序列,人类为 171bp,保护和稳定
染色体。
? 近来又发现微卫星 DNA,又称简
单重复序列,一般由 1-6bp的串联
重复单位组成,有 2bp,5bp,6-
7bp不等,以 2bp为常见。人类基
因组中 2bp( ≥14)的重复序列呈
高度多态性。采用限制性长度多
态性( RFLP)分析,可用于基因
连锁的遗传标记,广泛用于诊断。