第三章 基因组的结构与功能
?Virus genome
?Prokaryote Genome
?Eukaryote Genome
? 基因 (gene):是 DNA分子上具有遗传效应
的特定核苷酸序列的总称,是贮存遗传
信息的遗传单位。
? 基因组 (genome):表示某物种单倍体的
总 DNA。
千碱基对
/
染色体
长度
(cm)
染色体数
(单倍体) 形 状
原核生物
病毒 SV40 5.2 0.00017 1 环状
噬菌体 φX174 5.4 0.00018 1 线状单链
噬菌体 λ 46 0.0015 1 线状
细菌大肠杆菌 4000 0.13 1 环状
真核生物
酵母 1000 0.033 17
果蝇 41000 1.4 4
人 125000 4.1 23
不同生物体中 DNA的大小
第一节 病毒基因组
一、病毒基因组核酸的类型
1、双链 DNA
多数动物病毒,如腺病毒、疱疹病毒、痘
病毒,乙肝病毒等,环形、线形。
HIV:先转录出一个 RNA中间体再通过逆转

2、单链正股 DNA
序列与 mRNA相同的为正股( +),与
mRNA互补的为负股( — )
3、双链 RNA 以负链 RNA为模板转录出 mRNA,
如呼肠孤病毒及噬真菌体。
4、单链负股 RNA
5、单链正股 RNA,
如逆转录病毒 RNA cDNA RNA
病毒基因组结构特点,
1.大小相差较大
2.核酸的结构不同
3.病毒基因组有连续的和不连续的
4,编码序列大于 90%
5.单倍体基因组(除逆转录病毒外)
6.基因有连续的和间断的
7、相关基因丛集 病毒基因组核酸序列
中功能相关的蛋白质基因往往丛集在基
因组的一个或几个特定的部位,形成 一
个功能单位或转录单元。
8、基因重叠 同一段核酸序列能够编码 2
种或 2种以上蛋白质。重叠基因虽然共用
一段核酸序列,但转录成的 mRNA链的
开放阅读框( ORF)不同,产生的蛋白
质分子大不相同。
几种典型的病毒基因组
1.SV40病毒基因组
? 动物病毒中以 SV40研究较多,由 sweet 和
Hilleman从恒河猴细胞分离。无包膜,直
径 45nm,双链环状 DNA,DNA长 5.2kb。
在自然界不引起疾病和肿瘤,当大量接种
于免疫缺损动物或新生动物时,引起肿瘤
发生。 SV40基因编码两种抗原。
2.乙型肝炎病毒 ( HBV) 基因组
? 不同毒株的 HBV以负股 DNA为模板转录的
RNA均有 4个开放阅读框架( ORF):S,C、
P,X。
? S区段编码病毒的外膜蛋白,
? C区段编码 HBV核心抗原( HBcAg)
? P区段编码 DNA聚合酶
? X区段位于 C区段上游。
3.逆转录病毒( retroviruses)
单链正股 RNA
基因组的一般特征
5′帽 -R-U5-PB--DLS-Ψ-gap-pol-env-(onc)-C-
PB+-U3-R-poly(A)n
▲ 编码区,3 个基本的结构基因
gap编码病毒衣壳蛋白; pol编码肽链内切酶、
一个逆转录酶和一个与前病毒整合有关的
酶; env编码包膜蛋白。
5′帽 -R-U5-PB--DLS-Ψ-gap-pol-env-(onc)-C-PB+-U3-R-
poly(A)n
▲ 非编码区
( 1) R区,20~80个核苷酸。
( 2)引物结合区( PB):位于 5端的 PB区引导起始负链
cDNA的合成,用 PB-表示。
( 3) U区:位于 R区与 PB 区之间。 U5与转录终止和加
polyA有关,U3含强启动子,起始转录 RNA。
( 4) DLS,Ψ和 C区。 DLS是两条病毒( +) RNA链以
氢键相结合的位点。 Ψ为包装信号。可使 RNA包入病
毒颗粒; C区不编码蛋白质,为调控区。
人类免疫缺陷病毒( HIV Genome )
? HIV(human immunodeficiency virus)俗称艾滋病
毒 (AIDS)是逆转录病毒的一类,引起人类获得性
免疫缺损综合症,长约 9.3kb,除了逆转录病毒一
般的特征外,另外至少含有 6 个调控基因如 tat、
rev,nef,vif,vpu及 vpr。
? 已发现的 HIV有两种,HIVⅠ 和 HIVⅡ, HIVⅠ 从
欧洲和美洲分离的毒株,致病力强,是引起全球艾滋
病流行的主要病原 ;HIV Ⅱ 毒力较弱主要局限于非
洲西部。
? nef(negative regulation factor,nef)
兼有正负调节效应。
? vif编码病毒感染因子 (viral infectivity
factor,vif)
? vpr编码病毒蛋白 R(viral protein R)激活
基因的表达。
? vpu:HIV-1
? vpx:HIV-2
小结
? 1.掌握基因、基因组的概念以及逆转录
病毒基因组复制方式。
? 2.熟悉病毒基因组结构与功能特点;
第二节 原核生物基因组
一、原核生物基因组结构与功能的特
点,
1、常仅由一条环状双链 DNA分子组成
2.只有一个复制起始点。
3.具有 操纵子( operon)结构。
4.编码顺序一般不会重叠。
5.基因是连续的,无内含子,转
录后不需剪接。
6.编码区在基因组中所占比例远远大于真
核基因组,小于病毒基因组。
7.基因组中重复序列少。
8.具有编码同工酶的基因( isogene),
9.细菌基因组中存在可移动的 DNA序列,
如:插入序列和转座子。
10.在 DNA分子中具有多种功能的识别区
域。
二,质粒( plasmid)
1.定义:存在于细菌染色体外能独立复制、
稳定遗传的共价闭合环状 DNA分子。
(大小在 1~200 kb)
2.质粒的分类
? 按功能,
R质粒:抗药性质粒
F质粒 (fertility factor):性质粒( sex plasmid)
可决定细菌的性别
Col质粒:大肠杆菌素质粒,合成大肠杆菌素,
杀死不含大肠杆菌素质粒的亲缘细菌。
? 根据质粒能否在细胞间进行传递,
接合型质粒
可移动型质粒
自传递质粒
? 按复制机理,
严紧型质粒( stringent plasmid):即低拷贝
数质粒
松弛型质粒( relaxed plasmid):高拷贝数
质粒。
3.质粒的特性
? 1、能自主复制。
? 2、质粒的不相容性( incompatibility)两
种亲缘关系密切的不同质粒不能共存于一
个宿主菌。
? 3、质粒可以转移。
质粒 DNApBR322
EcoRⅠ, PstⅠ,
HindⅢ,
BamHⅠ,
SalⅠ 只有一个
酶切位点,便
于外源基因的
插入。
5.质粒 DNA的提取
? 1、细菌的培养:可加少量抗生素(如氯霉
素)抑制宿主蛋白质的合成,质粒大量扩
增。
? 2、细菌的收集和裂解:离心弃上清
? 3、质粒 DNA的分离纯化
三、转位因子 (transposable element)
? 定义:能在一个 DNA分子内部或两个 DNA
分子之间移动的 DNA片段。
类型,
1、插入序列( insertion sequence,IS)
2、转座子( transposon,Tn)
3、转座的噬菌体( transposable phage )
1.Insertion sequence
? 由一个转位酶基因及两侧的反向重复序列
组成,不带任何其它基因,一类简单转位
因子,长度约 700~2000bp 。
? 转位时复制宿主靶位点一小段 DNA
( 4~15bp)形成两端的正向重复序列。
? 反转重复( inverted repeated):由反方向互补的
两个 DNA片段组成,两个反转重复序列又叫回文
序列 (palindrome sequence)。
? 镜像重复 (mirror repeat):由反方向完全相同的两
个序列组成。
? 直接重复 (direct repeat):由同一方向完全相同的
两个序列组成。正向重复序列、反向重复序列。
2.转座子( transposon)
? 一类较大的可移动成分。除有关转座的基
因外,至少带有一个与转座作用无关并决
定宿主菌遗传性状的基因。
? 转座子中的转位酶常称为转座酶,其功能
是介导转座子插入到 DNA的其它部位。
? 复合型 Tn:由一个基因序列及两侧臂组成。
两侧臂为 IS序列。
? TnA族 T n:两端是正向或反向重复序列,中
间有与 Tn功能相关的基因(编码转座酶)
及抗生素抗性基因。总是作为一个单位进
行转座,其末端不能单独转座。
? 接合型 Tn,
3.Transposable phage
? 具有转座功能的溶源性噬菌体,包括
Mu 和 D108等。







? 四、细菌基因组学研究及意义
小结
? 掌握质粒、转位因子、插入序列、转
座子的基本概念。
? 熟悉原核生物基因组结构特点与功能。
第三节 真核生物基因组
? 基因组结构与功能的特点
? 基因组结构
? 人类基因组的组织结构特征
? 人类基因组计划
一、真核生物基因组结构与功能的特点
? 1、体细胞多为二倍体
? 2、基因组结构复杂
? 3、转录产物为单顺反子
? 4、含有大量重复序列
5、非编码序列( non-coding sequence NCS)占
90%以上。
6、断裂基因( split gene)。
基因与基因间的非编码序列为间隔 DNA
( spacer DNA),
? 7、功能相关的基因构成各种基因家族,可
串联在一起,也可相距很远。
? 8、有自私基因( selfish DNA),
二、真核生物基因组的结构
? 结构基因
? 顺式作用元件( cis-acting element)
? 基因家族 (gene family)
? 重复序列 (repeat sequence)
? 端粒 (telomere)
(一)结构基因
? 定义:可转录产生 mRNA并指导蛋白质合
成的一段 DNA称为结构基因 。
? 内含子
? 外显子
(二)顺式作用元件( Cis-acting
elements)
? 定义:与结构基因表达调控相关、能够被基
因调控蛋白特异性识别和结合的 DNA序列 。
包括 启动子、增强子、上游启动子元件、反
应元件、加尾信号 等。
? 反式作用因子( trans-acting elements),可
通过结合顺式作用元件而调节基因转录活性
的 蛋白质因子 。
? 转录因子( TF):直接、间接结合 RNA聚
合酶的反式作用因子,均为蛋白质。
1.启动子( promoter)
? 是 RNA聚合酶特异性识别和结合的
DNA序列,位于结构基因转录起始点
的上游 -25bp处,本身不被转录。
? 启动子必须与转录因子结合才能被
RNA聚合酶识别与结合。
? TATA盒。
2.上游启动子元件( upstream
promoter elements)
? TATA盒上游的一些特定的 DNA序列。
? 反式作用因子能与这些元件结合调控基因
的转录效率。
? 上游启动子元件包括 CAAT盒,CACA盒及
GC 盒 。
? CAAT盒,5`GCNCAATCT3`
? GC盒,5`CCGCC3`
? CACA盒,GCCACACCC
3.反应元件( response element)
? 定义:能介导基因对细胞外的某种信号产
生反应的 DNA序列,称为反应元件。
一些信息分子的受体被细胞外信息分子
激活后,能与特异 DNA序列的结合,调控
基因的表达。。
? 糖皮质
? 激素反应元件( GRE)
4.增强子( enhancer)
? 指能使和它连锁的基因转录频
率明显增加的 DNA序列。
? 其中含有多个能被反式作用因子识别与结
合的顺式作用元件,能增强邻近基因的转
录。
? 增强子通常具有下列性质,
? 1、增强效应十分明显,一般能使基因转录频
率增加 10-200倍。
? 2、增强效应与其位置和取向无关,不论增强
子以什么方向排列( 5‘→3’ 或 3‘→5’ ),甚至
和基因相距较远,或在基因下游,均表现出
增强效应;
3、大多为重复序列,一般长约 50bp,适合与
某些蛋白因子结合。其内部常含有一个核心
序列,GTGTGGAAAG,是产生增强效应时
所必需的;
4,增强效应有严密的组织和细胞特异性,
说明只有特定的蛋白质(转录因子)参与才
能发挥其功能;
增强子的作用原理,
一种观点认为,增强子为转录因子提供
进入启动子区的位点。第二种认为,增强子
能改变染色质的构象。因为增强子区域容易
发生从 B-DNA到 Z-DNA的构象变化。
增强子的功能是可以累加的。 SV40增强子序列可以
被分为两半,每一半序列本身作为增强子功能很弱,
但合在一起,即使其中间插入一些别的序列,仍然是
一个有效的增强子。因此,要使一个增强子失活必须
在多个位点上造成突变。
? 负增强子( negative enhancer)又称沉默子
( silencer):负调控序列。
? 1986年 Maniatis
5.加尾信号
? 结构基因的最后一个外显子中有一个保守
序列 AATAAA与下游一段 GT丰富区或 T丰
富区共同构成 polyA加尾信号。
? 与 RNA聚合酶结合的延长因子能识别这种
结构并与之结合,然后在 AAUAAA下游
10~30个碱基的部位切断 RNA并加上 polyA
尾巴。
(三)基因家族( gene family)
? 指核苷酸序列或编码产物的结构具有一定
程度同源性的一组基因。
? 假基因( pseudogene),在多基因家族中
并不能表达出有功能的产物的基因。
基因家族的类型,
? 1、核酸序列相同
即为多拷贝基因。如 rRNA基因家族,
tRNA基因家族,组蛋白基因家族。
球蛋白基因
5.基因超家族( gene superfamily),
指一组由多基因家族及单基因组成的更大的
基因家族。
? 基因家族与基因超家族的区别,
基因家族,核苷酸序列或产物有一定的 同源
性。
基因超家族,可能起源于相同的祖先基因,
但它们 功能 并不一定相同。
? 免疫球蛋白基因超家族,
与免疫有关的一些分子的基因
与免疫无关的成员的基因
丝氨酸蛋白酶基因超家族
蛋白质水解酶
载脂蛋白
(四)重复序列( repeat sequence)
1,高度重复序列:这类重复序列一般较短,
长 10-300bp,在哺乳类基因组中重复 106次
左右,占人的基因组 DNA序列总量的 20%,
功能不知。如卫星 DNA和反向重复序列。
2、中度重复序列:重复次数为 101~105。
3、单拷贝序列:大多数编码蛋白质的结构基
因属这一类。
(五)端粒( telomere)
? 真核细胞线性染色体末端的一种特殊
结构,由简单重复富含 G的 DNA序列
及端粒结合蛋白组成。
功能:保证 DNA的完整复制
保护染色体末端
决定细胞的寿命
三、人类基因组的组织结构特征
(一)人类基因组的重复顺序
1、反向重复序列( inverted repeats),5%
2、串联重复序列( tandem repeats):具有一个
固定的重复单位,头尾相连。 10%
( 1)编码区串联重复顺序
( 2)非编码区串联重复顺序
3、散在重复顺序( interspersed repeats)
? 反向重复序列 ( inverted repeats)
指两个顺序相同的互补拷贝在 DNA链上呈反向排列。
一种形式为两个反向排列的拷贝之间隔着一段间隔
顺序如,
5`AAACCACCGCTGGTAGCGGTGGTTT3`
3`TTTGGTGGCGACCATCGCCACCAAA5`
另一种是两个拷贝反向串联在一起,也称为回文结构
( palindrome),
串联重复序列( tandem repeats),
? 1、编码区串联重复顺序:如组蛋白基因。
编码五种组蛋白的基因密集在一个基本的
7.0kb的重复单位上,各重复单位之间有高
度的序列一致性。
? 2、非编码区串联重复顺序,
常存在于间隔 DNA和内含子内。
是组成卫星 DNA( satellite DNA)的基础。
卫星 DNA( satellite DNA)
定义:在蔗糖或氯化铯密度梯度离心中所
观察到的位于主带 DNA旁边的小带 DNA。
? 按重复单位的长短,又可分为大卫星、小
卫星和微卫星。
? 1.大卫星 DNA( macrosatellite
DNA)又称为经典 DNA。由大的串
联重复序列构成,总长度 100kb~
几个 Mb。根据浮力密度的不同分
为 Ⅰ, Ⅱ, Ⅲ, Ⅳ 和 α,β卫星
DNA。各类型都由不同的重复顺
序家族组成。
? 小卫星 DNA( minisatellite DNA)由中
等大小 的串联重复序列构成,总长约
0.1~20kb,分布在所有染色体,往往
近于端粒处。
? 高度可变的卫星 DNA、端粒 DNA
? 微卫星 DNA( microsatellite DNA):重
复单位为 1~5 bp,重复次数为 10~60次,
总长度小于 150bp,常见以 (AC)n和
(TG)n二聚核苷酸为重复单位,由
Miesfeld 1981年发现。 人类基因组 DNA
中平均每 6~ 10kb就有一个 微卫星 DNA 的
重复位点,其多态性成为法医中的个人识
别和亲子鉴定的丰富来源。
3kb
人类基因组 DNA的多态性
? DNA多态性,个体间基因的核苷酸序列存
在着差异性称为 DNA(基因)多态性。
分类,
? DNA位点多态性( DNA site polymorphism)
? 限制性片段长度多态性( RFLP)
? 串联重复顺序多态性( tandem repeats
polymorphism)
DNA位点多态性( DNA site
polymorphism)
? 由于等位基因间在特定位点上 DNA序列存
在差异造成的。 ABO血型组是发现的第一
个人类 DNA多态性。
? 人类白细胞抗原( HLA)是最复杂最具多
态性的体系,位于 6 号染色体。仅其中的
DR抗原编码位点有 60多个等位基因。
限制性片段长度多态性( RFLP)
? 用同一种限制酶消化不同个体的 DNA时,会得到
长度各不相同的限制性片段类型。当碱基组成的
变化改变了限制性内切酶识别位点时,就会得到
不同的限制性片段类型,这样的位点称为多态性
位点。
? 通过限制酶酶切片段的长度多态性来揭示 DNA碱
基组成不同的技术称为限制性片段长度多态性技
术( RFLP技术)。
? PFLP的基础是高度重复序列和点突变。
串联重复顺序多态性
? 重复单位很小,但重复次数有较大的变化,主要
发生在小卫星 DNA和微卫星 DNA中,也称为可变
数目的串联重复序列 ( variable number of tandem
repeats VNTRS)。
? 小卫星 DNA多态性:由于重复单位的数目不同引
起。
? 微卫星 DNA多态性:由于重复单位的重复次数不
同而具有高度的遗传多态性。
小结
? 掌握:顺式作用元件,反式作用因子,
结构基因,断裂基因,间隔 DNA,反应
元件,增强子,基因家族,基因超家族,
DNA多态性,端粒的基本概念;
? 熟悉真核生物基因组结构与功能的特点。
? 了解人类基因组的重复顺序、人类基因
组中的 DNA多态性,人类基因组计划。