第十二章 基因组的结构解剖
按照基因的染色体学说, 一个生物细胞核内所
带有的基因呈串联排列在长长的DNA分子上, 构
成一个基因组 ( genome) ( 所谓的基因组是指能
维持配子或配子体正常功能的最低数目的一整套基
因 ) 。 有些基因是一个个单独分布的在基因与基因
之间, 以及在一个基因内部有着长长的非编码区域,
分别称为间隔顺序 ( spacer sequence) 和内含子
( nitron) 。 有些功能相关的基因是排列在一起的,
由共同的调控系统加以调节, 形成所谓的操纵子
( operon),有些功能相同的基因, 则紧密排列在
一起, 形成基因簇 ( gene cluster) 或称为基因复合
体 ( gene complex) 。
第一节原核生物的基因组结构
一, 操纵子 ( Operon )
1961年由 Jacob & Monod提出, 指由操纵基
因和启动基因以及紧密连锁着的若干个结构基
因所组成的功能单位, 其中结构基因的转录为
操纵基因所控制 。
I:调节基因;P:启动基因;O:操纵基因;Z:
半乳糖苷酶基因;Y:半乳糖苷透性酶基因;A:转
乙酰基酶基因 。
现在已发现有多种类型的操纵子, 它们的调
节控制机制, 将在下一章介绍 。
二, 转座因子 ( Transposable Element)
转座因子是指可以在染色体内或染色体间以
及染色体与质粒 ( plasmid) 间, 从一个位置转
移到另一个位置的一段脱氧核糖核酸序列 。
转座因子的类别与结构特征,原核生物中的转
座因子, 根据分子结构和遗传学特性可分为三
种类型 。
?插入序列 ( insertion sequence,IS ),这是
一类比较小的转座因子, 除带有转座作用有关
的基因外, 不带有任何其它基因 。 大小在 768
( IS1) ~1530( IS50-R) bp,两端有 9~41bp的
IR。
?转座子 ( Transposon,Tn),这是一类较大的
转座因子, 除带有转座作用有关的基因外, 还
带有其它一些基因, 例如抗药性基因 。 大小在
2086( Tn1681) ~205000( Tn4) 之间, 两端
有顺向或反向重复序列, 这些重复序列有些就
是 IS( 称复合型转座子 ), 有些不是 IS( 称
TnA族 ) 。
Ampr
Tn3
?某些温和噬菌体 ( Temperate phage),例如
大肠杆菌的Mu ( Mutator) 噬菌体 。 该噬菌
体感染大肠杆菌后使大肠杆菌产生约 2%的突
变而得名 。 Mu可以发生转座, 但在结构上与
IS或 Tn有一定的区别, 其末端不含有重复序
列而是左端带有宿主染色体的 1500bp,右端
带有 100bp。
转座因子的遗传学效应,
( 1 ) 引起插入突变 。
( 2 ) 插入位置上出现新的基因 。
数核苷酸对的重复。
(4)某些转座因子转座后原来位置上保持原
有的转座因子,而仅是其拷虫的转座。
( 5)转座的排它性:一个质粒上如果有一个
Tn3,则能排斥另一个 Tn3转座到该质粒上,
这样可以控制一个细胞内的转座因子的总数。
( 6)插入位点的专一性,Mu可以插入到大肠
杆菌染色体的任何位置,但有些转座因子如
Tn10则只能在特定的位点( GCTNAGC)插入。
( 7)促使插入位点染色体发生缺失:缺失发
生率比自发缺失高 10.2~10.3倍。缺失发生在转
座因子外的第一个核苷酸开始,向外侧延伸。
( 8)打开临近的沉默基因
( 9) 切离 ( Excision ),转座因子
可以从原来的位置上消失, 这种现象称为切
离 。 准确的切离可带来和回复突变一样的遗
传学效应;不准确切离则会带来多种效应,
包括缺失, 倒位, 易位等 。
切离和转座是两个不同的概念。
三, 重叠基因 (Overlapping gene)
?ΦX174:1977年Sanger等人对
Φ× 174噬菌体的核苷酸顺序进行分析时,
发现了基因的重叠现象, 同时还发现遗传密码
也有重叠现象 。
,是指相邻的两个基因共用一
段核苷酸顺序的现象 。
A B C D E J F G H K
起始 3973 5064 133 390 568 845 1001 2386 2923 51
终止 133 48 390 845 840 961 2275 2911 3903 218
有三中重叠方式:
完全重叠:如 B基因落在 A基因内,E基因落在 D基因内。
部分重叠:如 K基因与 A及 C基因。
少数核苷酸重叠,A基因与 C基因
ΦX174的重叠基因主要存在于 5000-0-1000的区
域内,这些基因也称 nest genes.
?G4噬菌体:基因K全长都与其它基因重叠,
5 ’ 端区与基因A的最后86个Nt重叠,3 ’
端与基因C的开头89个Nt重叠,在①和②
两个位点上,DNA阅读框的三种方式都得到
应用。
H A C D
B K


①, B
C
T T C T G A T G
phe 终止
ser asp
起始

A A A T G A G G
K
K asn glu
A lys 终止
C 起始 arg
?Qβ噬菌体:与 ΦX174及 G4的重叠不同,Qβ
噬菌体的重叠基因是按相同的阅读框阅读的,
即所谓的通读( read through)。如其外壳蛋白
基因完全落在 A1基因内。
外壳蛋白 400bp
A1基因 800bp
?病毒及真核生物,SV40病毒的 t基因落在 T基
因内; VP1,VP2,VP3三个外壳蛋白之间有
122bp的重叠。
果蝇蛹角质蛋白基因( pupal cuticle protein
PCP)落在参与嘌呤代谢的 Gart基因的第一内含
子内; Dopa脱羧酶基因 Ddc与临近基因有一个
88bp的重叠,两个重叠基因是以不同的模板
链反向转录的。
基因重叠的意义:
?用有限的核苷酸储存最大的信息量
?与基因的表达调控有关
?在进化上有一定的意义
第二节 真核生物的基因组结构
一、断裂基因( split gene)—— intron & extron)
发现,1977年法国科学家 Chambon在研究雌激素
与蛋白质合成的关系时以外发现,并获 1993年诺
贝尔奖。
他从鸡的输卵管和血球中分离核 DNA,分别用
EcoRI和 HindIII酶解、电泳,然后与卵清蛋白
cDNA探针进行 Southern bolt分子杂交,发现卵清
蛋白基因在 cDNA和核 DNA的结构有些不同。
血球 输卵管 血球 输卵管
EcoRI HindIII
Southern blot,1975年 E.M.Southern建立
酶解 电泳 拍照
DNA DNA片段 电泳胶 变性
中和 转移到膜上 漂洗 封闭
与 probe杂交 漂洗 反射自显影
结果观察
转移的方法:虹吸法、电转移法及真空转移法。
其它分子杂交:
?Northern blot,1979年 J.C.Alwine建立的 DNA-
RNA杂交
?Western blot:抗原与抗体反应
?Southwestern blot:利用 Southern blot与
Western blot两种方法的特点而设计,用于检测
与蛋白质结合的特异 DNA序列。
二、多基因家族( multigene family),也称基
因家族( gene family):指来源相同、结构相
似、功能相关的一组基因。家族成员可以排列
在一起构成所谓的基因簇( gene cluster),也可
以分散排列。
基因家族可分为四种类型:
?简单的多基因家族
?复杂的多基因家族
?不同场合表达的复杂的多基因家族
?散在分布的多基因家族,如癌基因。
三、基因复合体( gene complex),也称超基
因( supergene):是指紧密连锁在一起的共同
决定某一性状的一组基因。亦有人认为超基因
就是一个大的基因簇,其成员可达几百个。
人类的主要基因复合体有:
? 免疫球蛋白基因复合体
?主要组织相容性复合体( major
histocompatibility complex,MHC)
?次要组织相容性复合体( minor
histocompatibility complex)
MHC是一组决定体细胞表面抗原的基因,这些抗原
称为同源白细胞抗原( homologous leucocytic antigen
HLA)。
MHC位于 6p21~6pter,已知有 35个基因座位,有几百
个基因。这些基因编码两类抗原:
I类抗原,包括 A,B,C,E,F,G,H,J等基因座
位。这类抗原在 Tc细胞特异地杀伤被感染细胞是起约
束作用,即 Tc细胞必须同时识别病毒抗原及靶细胞的
I类抗原才能起杀伤作用。
II类抗原,包括所有 D系列的基因座位。这类抗原只
存在于 B细胞和巨噬细胞表面,在抗原提呈时起作用,
即 TH细胞必须同时识别外来抗原及 II类抗原。
两个概念:
?单倍型( haplotype):指若干个决定同一形状的紧
密连锁的基因构成的基因型。
?连锁不平衡( linkage disequilibrium):指由于基因
的紧密连锁而导致的一个基因的边上总是出现某个基
因。
四、假基因( pseudogene):
在多基因家族中某些成员和编码某一蛋白质的
结构基因在结构上相似, 但并不产生有功能的
基因产物, 这些基因称为假基因 。
两中类型的假基因:
?由正常基因的突变, 缺失, 重复等原因导致基
因不能正常表达 。
?缺少正常基因的部分元件, 内含子等, 更象正
常基因经反转录后产生的, 有人称其为加工基
因 ( processed gene), 反转录基因 ( retrogene)
及反转录转座子 ( retrotrsansposon) 。
五、转座因子
转座因子最早是在真核生物中发现的。 40年代,
McClintock在研究玉米籽粒糊粉层色素合成时发现,
与色素合成有关的 C基因突变和回复突变的频率很高,
这些突变与染色体内一些位置不确定的因子有关。由
此提出了转座因子的概念。
真核生物中研究得最清楚的是玉米的激活 ——解离系统
( Activator-Dissociator,Ac-Ds) 。 在 Ac-Ds系统中,
包括两个位点, 一是激活位点 ( Ac), 一是解离位点
( Ds) 。 Ac和Ds都可转座, 但Ds在转座有赖于
Ac的存在, 而Ac则可自主转座 。 事实上Ds是A
c的缺失而形成的 。
Ds的转座可带来两个方面的遗传学效应, 一是导致
染色体断裂, 另一是插入某一基因而使之失活 。 Mc
Clintock就是在研究玉米籽粒糊粉层色素合
成时发现Ds插入与合成色素有关的C基因的失活,
从而发现Ac-Ds系统
Ac全长 4500bp,末端有 11bp的 IR,有两个基因, 即
转座酶基因和阻遏物基因, 因此可以自主转座 。 Ds
是 Ac的缺失类型, 缺失范围可以从 0.4kb~4kb,甚至
只剩下 IR也可以在转座酶作用下发生转座 。
除了玉米外, 果蝇, 酵母地转座因子也研究的比较多 。
注意:真核生物转座因子的转座是切离转座 。
六、原核基因组与真核基因组的比较
1, 真核生物基因组比较大 。
2, 真核生物的一个基因组包括若干个染色体, 一般
不呈环状 。
3, 真核生物的DNA全长都与蛋白质稳定地结合,
构成染色体 。 原核生物的DNA并不是全长与蛋白质
稳定地结合 。
4, 真核生物DNA上有大量的重复序列 。 编码顺序
仅占基因组的0, 5-5 %, 而原核生物基因则大多
是编码顺序 。
5.真核生物基因组存在无功能的假基因。
6, 原核生物的基因组中功能相关的基因常聚集在一
起构成操纵子 。 真核生物的基因组虽然作用上密切相
关的基因聚集在一起的情况也并不少见, 但关于操纵
子的确切报道还是绝无仅有 。
第三节 tRNA与 rRNA基因
一, tRNA基因 ( tDNA,4S基因 )
,原核生物tDNA:原生物tDNA的分
布有二种情况:
( 1 ) 以基因簇形式组成多顺反子转录单位:
在 E.coli中以基因簇形式组成的多顺反子已测定
了约60个, 例如1981年鉴定的一个操纵子
含7个 tRNA基因,Met-Leu-Gln-Gln-Met-Glu-Glu,
它们可以转录出一条RNA, 经剪切后形成7个
tRNA 。
( 2 ) 与 rRNA基因 ( rDNA) 连接在一起:原
核生物的 tDNA有些是与 rDNA连接在一起, 随
rRNA一道转录 。
2, 真核生物tDNA:真核生物tDNA也是
多拷贝, 成簇地排列在一起的, 与原核生物不同
在于它的是单顺反子转录的并且具有内含子 。
二, rRNA基因 ( rDNA )
,原核生物 rDNA:原核生物有 16S,23S和
5S三种 rRNA,这三个 rRNA串联在一起, 在其间
又插入一些 tRNA组成一个操纵子, 转录出一条
30S rRNA的前体, 经剪切加工后形成三种r R
NA 。

形成一个基因复合体 。
2, 真核生物 rDNA:真核生物有 18S,28S,
5.8S和 5S四种 rRNA。 在真核生物中, 18S,
28S和 5.8S rDNA串联在一起构成一个基因簇,
这一基因复合体位于核仁组织者区 。 转录时
是 18S,28S,5.8S rDNA一起转录 ( 即多顺反
子转录 ) 出一条 45S rRNA前体, 经剪切加工
后形成三种 rRNA。 位于核仁组织者区的
rRNA,由 RNA pol I转录 。
真核生物的 5S rRNA位于核仁组织者区之外,
也是多拷贝重复的, 由 RNApol III转录 。
生物种类 18S/28S
(16S/23S)
5S
大肠杆菌 7 7
酵母 140 140
果蝇 150~1500 165
人 280 2000
非洲爪蟾 450* 24000
几种生物的 rRNA基因数目
*在卵母细胞内可扩增达 1000~4000拷贝
第四节基因的概念及其发展
一, 经典遗传学关于基因的概念
出来的, 用于取代孟德尔的遗传因子, 但在这
一阶段基因仍是一个形象的概念, 并不知道它
的物质基础是什么, 而只能通过基因的遗传学
效应来感知它 。 到了30年代摩尔根等人首次
将基因与染色体联系起来, 认为基因在染色体
上呈直线排列 。 按照经典遗传学对基因的概念,
基因具有下列共性:
1, 基因可自我复制并具有相对稳定性, 在减
数分裂和有丝分裂中有规律地进行分配 ——这
是染色体的主要特征之一 。
2, 基因在染色体上占有一定的位置 ( 位点 ),
并且是交换的最小单位, 即在重组时不能再分
割的单位 ( 即基因是一个重组单位 ) 。
3, 基因是一个突变单位, 是以整体进行突变
的 。
4, 基因是一个功能单位, 它控制着有机体生
长和发育中的一个或某些性状, 如红花, 白花
等 。
二, 顺反子
50年代Benzer在T4噬菌体r Ⅱ 基因的
研究中发现基因并不是最小的不可分割的单位, 基因
内部还有精细的结构 。 按照现代遗传学的概念, 基
因的突变重组, 功能这三个单位应分别是:
?突变子 ( muton),是性状突变时, 产生突变的最小
单位 。 一个突变子可以小到只有一对核苷酸 。
?重组子 ( recon),在发生性状重组时, 可交换的最
小单位, 一个交换子只包含一对核苷酸 。
?顺反子 ( 作用子 ) ( cistron),这是基因的功能单
位, 即起作用的单位 。 基本上 符合通常所指的基因 。
?互补测验:用于测定不同突变之间的功能关系。方
法是使两个突变处于反式结构,观察两个突变之间是
否可以互补,可以互补说明两个突变处于不同的功能
单位,反之,生命处于相同的功能单位。
?顺反位置效应与顺反子:互补测验中,两个突变位
点处于反式结构。如果将两个突变位点处于反式,结
果会有什么不同呢?
Benzer将顺式结构与反式结构的遗传学小应不同的现
象称为顺反位置效应。并将具有顺反位置效应的功
能单位称为顺反子( cistron)。
三, 分子遗传学关于基因的概念
基因是 DNA( RNA)分子上一段特定的
核苷酸顺序,它具有突变、重组,转录 并产
生基因产物( RNA或蛋白质)的遗传学功能
单位。