第十章 基因组与比较基因组学
20世纪人类科技发展史上的三大创举
90年代人类基因组计划
40年代第一颗原子弹爆炸
60年代人类首次登上月球
? 人类基因组计划
? DNA的鸟枪法序列分析技术
? 比较基因组学及功能基因组研究
Contents
一、人类基因组计划的启动
1986 年诺贝尔奖获得者 R.Dulbecco
( 杜尔贝科) 提出人类基因组计划 ——
测出人类全套基因组的 DNA 碱基序列
( 3 X 109 bp )
第一节 人类基因组计划
1975年,获诺贝尔生理医学奖
美国政府决定于 1990年正式启动
HGP,预计用 15 年 时间,投入 30 亿
美元,完成 HGP。
由国立卫生研究院和能源部共同
组成, 人类基因组研究所,
逐渐地,HGP 扩展为多国协作计
划。参与者包括,英、日、法、德和
中国 ( 1993年)
二、人类基因组计划的进展状况
( 1)截至 1998 年 10 月,完成 1.8 X
108bp,占 计划的 6% 。
( 2)完成一系列模式生物全基因组测定。
这些 模式生物全基因组 测定的完成有
重大理论与现实意义。
( 3) DNA 测序技术飞速提高
1998.5.9 J.C,Venter 等 宣布,组建商
业公司,投入 3 亿美元,3 年内完成。
接着又有若干家公司成立,
总共投入资金约 几十亿美元,
形成
,公,,私, 并进
格局
2000.6 完成并公布
人类基因组工作框架图 ( 90%)。
二 000年六月二十六日克林顿宣布
人类基因组草图绘制完成
美国国家人类基因组研究所所长弗朗西斯 ·柯林
斯在介绍情况。
人类基因组草图基本信息
? 由 31.65亿 bp组成
? 含 3~3.5万基因
? 与蛋白质合成有关
的基因占 2%
人类基因组 人类蛋白质
? 61%与果蝇同源
? 43%与线虫同源
? 46%与酵母同源
2000年 6月公共领域测序计划工作框架图
2000 年 12 月美、英等国科学家宣布绘出拟
南芥基因组的完整图谱,这是人类首次全部破译
出一种植物的基因序列。
2001 年 2月 16日
人类基因组, 精细图, 完成,(99%),
同时发表论文
美国 Science,Vol,291,No,5507
英国 Nature,Vol.409,p.860
DAN




2003年4月14日,人类基因组序列图
亦称, 完成图, ( 99.99%),提前绘制成
功。
三、人类基因组计划的科学意义
( 1)确定人类基因组中约 5万个编码基因的序列
及其在基因组中的物理位置,研究基因的产物
及其功能。
( 2)了解转录和剪接调控元件的结构与位置,
从整个基因组结构的宏观水平上理解基因转录
与转录后调节。
( 3)从整体上了解染色体结构,包括各种重复序列
以及非转录, 框架序列, 的大小和组织,了解各种
不同序列在形成染色体结构,DNA复制、基因转录
及表达调控中的影响与作用。
( 4)研究空间结构对基因调节的作用。有些基因
的表达调控序列与被调节基因从直线距离上看,似
乎相距甚远,但若从整个染色体的空间结构上看则
恰恰处于最佳的调节位置,因此,有必要从三维空
间的角度来研究真核基因的表达调控规律。
( 5)发现与 DNA复制、重组等有关的序列。 DNA的
忠实复制保障了遗传的稳定性,正常的重组提供
了变异与进化的分子基础。局部 DNA的推迟复制、
异常重组等现象则导致疾病或者胚胎不能正常发
育,因此,了解与人类 DNA正常复制和重组有关
的序列及其变化,将对研究人类基因组的遗传与
进化提供重要的结构上的依据。
( 6)研究 DNA突变、重排和染色体断裂等,了解疾病的
分子机制,包括遗传性疾病、易感性疾病、放射性疾
病甚至感染性疾病引发的分子病理学改变及其进程,
为这些疾病的诊断、预防和治疗提供理论依据。
( 7)确定人类基因组中转座子、逆转座子和病毒残余序
列,研究其周围序列的性质。了解有关病毒基因组侵
染人类基因组后的影响,可能指导人类有效地利用病
毒载体进行基因治疗。
( 8)研究染色体和个体之间的多态性。这些知
识可被广泛用于基因诊断、个体识别、亲子鉴
定、组织配型、发育进化等许多医疗、司法和
人类学的研究。此外,这些遗传信息还有助于
研究人类历史进程、人类在地球上的分布与迁
移以及人类与其他物种之间的比较。
? 以人类基因组和拟南芥基因组为例说明你对生
物基因组全序测定工作的科学意义与社会意义
的认识( 8分)
中国科学院 2002年
硕士学位研究生入学分子遗传学试题
遗传图谱 转录图谱
0.7 cM 或
kb
序列图谱物理图谱
100 kb
STS map
四张图:
物理图,转录图
遗传图,序列图
四,HGP的主要任务
1,遗传图(连锁图)
指基因或 DNA标记在染色体上的相对位置与遗传距离。
cM(基因或 DAN片段在染色体交换过程中分离的频率)
? 多态性,人的 DNA序列上平均每几百个碱基会出现
一些变异( variation),并按照孟德尔遗传规律
由亲代传给子代,从而在不同个体间表现出不同,
因而被称为多态性( Polymorphism)。
第一代多态性 标记 是 RFLP( restriction fragment
length polymorphism,限制性片段长度多态性)
第二代多态性 标记 是短的串联重复序列
包括小卫星 DNA和微卫星 DNA,其多态性主要来自重
复序列拷贝数的变化
小卫星 DNA— 由 15-65bp的基本单位串联重复而成,
长度一般不超过 20kb。
重复次数(小卫星 DNA区的长度)在人群中是高度变
异的;按照孟德尔的规律遗传
微卫星 DNA/简短串联重复( STR,STRP或 SSLP)
重复单元 2-8bp,通常重复 10-60次
CTAGCTTATATATATATATATATATATATAAGCTTGC
? 真核生物基因组中的 DNA重复序列主要有哪些类
型?简要说明基因组重复序列可能的生物学意
义以及基因组重复序列在分子标记研究中的应
用 ( 12分)
中国科学院 2002年
硕士学位研究生入学分子遗传学试题
第三代多态性 标记是 单核苷酸的多态性
( single nucleotide polymorphism,SNP)
SNP:是由于单个核苷酸改变而导致的核酸序列多态。
第一军医大学 2003年分子生物学
人类 99,9%的基因密码是相同的,
而差异不到 0,1%,不同人群仅有
140万个核苷酸差异。这些差异是由
,单一核苷酸多样性, ( SNP)产生
的,它构成了不同个体的遗传基础。
在整个基因组序列中,人与人之间
的变异仅为万分之一,从而说明人
类不同, 种属, 之间并没有本质上
的区别。
SNP与 RFLP和 STR标记的主要不同之处在于,它
不再以 DNA片段的长度变化作为检测手段,而直接
以序列变异作为标记。
2、物理图
以已知核苷酸序列的 DNA片段(序列标签位点,
sequence-tagged site,STS)为, 路标,,以碱
基对作为基本测量单位(图距)的基因组图。
3、转录图
以 EST( expressed sequence tag,表达序列
标签 ) 为标记,根据转录顺序的位置和距离绘
制的图谱。
EST:通过从 cDNA文库中随机挑选的克隆进行测序
所获得的部分 cDNA的 5'或 3'端序列称为表达序列
标签( EST),一般长 300-500bp左右。
4、序列图 (分子水平的物理图)
序列图是指整个人类基因组的核苷酸序列图, 也是
最详尽的物理图 。 1m
既包括可转录序列, 也包括非转录序列, 是转录序
列, 调节序列和功能未知序列的总和 。
2000年 6月公共领域测序计划工作框架图
第二节 DNA的鸟枪法序列分析技术
一,DNA的鸟枪法测序原理
1999 年 12
月用“逐个克隆
法”获得第一条
人类染色体 — 22
号染色体完成序

2000 年 3 月
用“全基因组
鸟枪法”获得
果蝇全基因组
序列。
2000年 6月公共领域测序计划工作框架图
二,DNA的鸟枪法测序的主要步骤
? 第一,建立高度随机、插入片段大小为 2kb左
右的基因组文库。
? 第二,高效、大规模的末端测序。
? 第三,序列集合。
? 第四,填补缺口。
Shotgun法序列拼接
Sequence Gap
三,DNA的鸟枪法测序的优缺点
优点:速度快
缺点:
● 随着所测基因组总量增大,所需测序的片段大量
增加
● 高等真核生物(如人类)基因组中有大量重复序
列,导致判断失误
一、比较基因组学 (Comparative Genomics)
概念:是基于基因组图谱和测序基础上,对已
知的基因和基因组结构进行比较,来了解基因
的功能、表达机理和物种进化的学科。
第三节 比较基因组学及功能基因组学研究
物种 完成
年份
总长度
/Mp
已完成总长
的百分数 /%
占常染色质
百分数 /Mb
基因数
/Mb
酵母 1996 12 93 100 483
线虫 1998 96 99 100 197
果蝇 2000 116 64 97 117
拟南芥 2000 115 92 100 221
人类第 21染色体 2000 34 75 100 7
人类第 22染色体 1999 34 70 97 16
人类全基因组
(Public Sequence)
2001 2693 84 90 12
人类全基因组
(Celera Sequence)
2001 2654 83 99-93 15
基本完成 DNA序列分析的真核生物基因组比较
二、功能基因组学研究
1,概念,利用结构基因组学提供的信息,以高
通量,大规模实验方法及统计与计算机分析为
特征,全面系统地分析全部基因的功能 。
2,基因功能的研究方法
( 1) 基因转导技术,导入细胞, 观察功能 。 该
方法用的最多, 技术最成熟 。
( 2) 基因敲除技术 ( gene knockout)
又称基因打靶 ( gene targeting) 。 这种
技术是通过基因工程的方法将一个结构已知但功
能未知的基因去除, 或用其他序列相近的基因取
代 ( 又称基因敲入 ), 然后从整体观察实验动物,
从而推测相应基因的功能 。 这种人为地把实验动
物某一种有功能的基因完全缺失的技术称为基因
敲除技术 。