绵羊基因组研究
遗传图和物理图谱
一、羊的基因组概念
?完整羊基因组由细胞核中的核 DNA和细胞质
中的线粒体 DNA上的所有基因组成。
?羊基因组项目的目标就是要鉴定出包含在这
两大部分 DNA上的全部基因 (编码基因和标
记基因 ),据目前估计羊基因组基因总数不超
过 10万个 。 羊基因组的研究内容包括:核基
因组中染色体数及形态结构, 即羊细胞核中
的染色体数 —— 绵羊二倍体 2n=54,单倍体
n=28,即 26条常染色体加上两条性染色体 X
和 Y。
遗传联锁图
物理图
基因组图谱
微卫星
其它 DNA多态片段
基因
DNA标记
BTA14 + BTA9
QTL 健康
QTL 生长
QTL 出生体重 -BTA14
QTL 断奶体重 -BTA9+BTA14
QTL 周岁体重 -BAT14
QTL 胴体重 -BTA14
估计位于绵羊 1号染色体 (Oar1)上 初生体重 QTL
=M-Marker
15cM
55cM
FISH
?羊核基因组染色体 Q,R,G等标准带型研
究已经完成 。 羊基因遗传联锁图和物理结
构图正在进行中 。
?羊的基因组中的所有基因通常可分为两大
类型:即
?I型基因 —— 主要为负责各种蛋白质氨基酸
编码的基因组成, 又叫结构基因或功能基
因;这类基因具有结构稳定, 变异小等特
性, 它们均有相应的基因产物 (蛋白质或酶
等 )。
?II型基因 ——主要为非编码的, 具有
高度变异, 不同大小的 DNA序列片
段所组成, 又称为 DNA标记位点,
这类位点均具有相当程度的多态性,
同时它们的在数量上远远多于 I型基
因, 估计它们约占整个羊基因组中基
因总数的 90%以上 。
?羊的 线粒体 DNA基因
组 (mtDNA)呈母性遗传,
全部碱基数为 16616
(Hiendleder 1998),并
且由 15个编码基因和 22
个 tRNA基因组成。
?绵羊基因组研究的主要
目标之一是通过基因组
图制作和应用,在 DNA
分子水平来定义和解释
绵羊的各种重要生产性
状的遗传基础 。
二、羊基因组图谱及制作
?1 基因组图谱概念
?羊基因组图谱包括羊基因组 连锁图,基因
组 物理图 和 物理与连锁图的比较图 以及 与
其它种 (如人、鼠、牛和猪等 )的比较图谱 。
?2 绵羊基因组连锁图 (linkage map)又称为
绵羊的基因组遗传图 (genetic map)。
– 它描述的是绵羊各种基因位点 (包括各类标记
位点 )在绵羊染色体上的 相对位置, 它是研究
各基因位点间共同遗传规律的重要基础 。 目
前它主要用 遗传标记位点 来确定基因位点间
的关系, 遗传标记既可是可表达的 DNA区段
(编码基因 ),也可是无编码功能的 DNA小片
段, 或 一个酶 切位点和一个点突变位点, 而
且其遗传方式均和普通基因一样遵循特定的
遗传规律 。 两个位点间的距离用 cM(centi-
Morgan)来测定 。
?1cM遗传距离等于 1百万碱基对 (bp)的物理
距离 。
?1cM定义为在同源姐妹染色体在形成单倍体
配子减数分裂期间发生 1%染色体重组 。 换
句话说, 当两个遗传位点在同一染色体片
段上的物理距离相隔 1百万 bp时, 它们在减
数分裂过程中发生重组的概率为 1%。
– 通常两个位点的物理距离越远, 它们发生重组
的概率就越大, 在未发生重组前的遗传距离也
就越大, 在连锁分析中发现它们的可能性也就
越大, 这样的两个遗传位点称为非紧密连锁遗
传位点 。 反之称为紧密连锁遗传位点 。
?3 绵羊的基因组物理图 (physical map)是染
色体上所有基因位点的 真实定位图 (例如限
制性酶切位点,功能基因,标记基因等 )。
基因物理位置通常不涉及基因的遗传行为,
只注重它们的存在位置、长度及结构形式。
用碱基数目来测量其距离或者说它们的长
度。
– 绵羊的基因组低分辨率的物理图是 28条染色体
上的不同类型的带型图,而最高分辨率的物理
图将是全部染色体上核苷酸或碱基数目与它们
的排列顺序。
?4 绵羊基因组项目的目标, 完全详细的绵
羊遗传图分辨率为 2Mb(1Mb=1cM),而物
理图分辨率定为 0.1Mb(0.1cM),检测出全
部碱基序列的分辨率则为 1bp。 绵羊基因组
bp总数估计约为 3× 109 bp,估计基因数不
超过 10万个 。 但是其中对重要经济性状起
主要控制作用的基因数要比此少得多, 估
计大约为 5千到 1万之间, 包括遗传疾病基
因在内 。 要获得绵羊整个基因组的精确基
因数要等到将全部基因组的 DNA序列测定
完成达到 1bp时才能下定论 。
三、绵羊基因组作图参考家
系 (Reference Family)和资源
?国际绵羊基因组图谱参考家系主要为新
西兰的 AgResearch IMF(International
mapping flock);澳大利亚的 CSIRO作图
参考家系 (15个 3世代全同胞共计 182个后
裔, 用 MOET和自然交配完成,最大全同
胞家系成员 29个, 最大家系有 55个后裔,
由 2头罗姆尼 (Romney)公羊和 9头携带
Booroola基因的美利奴母羊 (Merino)组成,
?该群体主要目的是用来发现羊毛生产和羊毛品质性
状 ),法国 INRA的 INRA401是一个大型多品种杂交
家系, 美国 MARC家系重点是羊肉性能研究 。 此外
还有几个孟德尔和多基因选择群体 (对羊毛, 羊肉
产量和质量控制, 抗寄生虫, 抗真菌 )。 其它资源
还包括绵羊 -hamster体细胞杂交, YAC中的基因组
文库和质粒载体, 绵羊 I型探针, RFLP频率图, 微
卫星标记引物等 。
– 进行绵羊基因组研究的关键实验室有新西兰的
AgResearcal Invermany Mosgil,澳大利亚的动物生物技
术中心, 美国的 Utah State的 Noelle Cockett,法国的
IRNA,以色列的 HEBREW大学, 以及主要进行绵羊线
粒体 DNA基因组的德国的 Giessen大学的动物遗传育种研
究所 。
四、绵羊基因组标记系统
?绵羊基因组图制作使用的主要分子遗传多态标记体
系为,
?微卫星标记 (MS or STR),估计绵羊基因组中的 MS
数量在 44000左右 (Stone等 1995);
?单位点 DNA小卫星 (SLM),
?限制性片段长度多态 (RFLP),
?单链一致性多态 (SSCP),
?红细胞抗体 EA(erythrocyte antigen)
?和蛋白质多态 (PROT)等 。
?绵羊基因组中 I型基因按国际基因术语专
业委员会规则命名,通常为基因产物或功
能的英文名称缩写, 例如绵羊 11号染色
体 上 的 生 长 激 素 基 因 GH1(growth
hormone 1)和 11号染色体上的羊毛角蛋白
基因束 KRT1(Keratin 1 cluster和 3号染色
体上的羊毛角蛋白基因束 KRT2(Keratin
2 cluster) 等, 可 参 见 下 列 地 址
http://www.ri.bbsrc.ac.uk/sheep/ark/loclist.h
tml
五,绵羊基因组遗传连锁图研究现状
– Crawford等 (1992)开始用微卫星标记构建绵羊
基因组遗传连锁图, 1994年建成有 52个遗传标
记, 19个连锁群, 长度 30cM的遗传连锁图,
1995年发表第一个有 246个多态标记的基因组常
染色体遗传连锁图, 图总长 2070cM,图中有 86
个微卫星标记直接来自绵羊, 126个微卫星标记
来自牛引物, 1个微卫星标记来自鹿, 另外 33个
为其它类型多态标记 。 该图覆盖了绵羊核基因
组的全部 26条常染色体 。 按现在标准该连锁图
属于低分辨密度第一代连锁图 。
?de Gortari等 (1998)报告了具有更高分辨
率的绵羊基因组第二代遗传连锁图 。
?图中有 519个标记, 其中 504个微卫星标
记, 常染色体上连锁图总长度 3063cM,
X染色体长度 127cM,总长度 3190cM;
标记间平均间距 6.4cM。 小于 5 cM的占
55%,大于 20 cM的标记为 3.8%。 519个
微卫星标记的平均杂合度 H=68.9%。
INTERNET上的绵羊基因组连锁图
?有三个即 SM1,SM2和 SMC,
?SM1为 Crawford等 (1995)用 IMF系谱完
成的固定框架连锁图 (static framework
linkage map);
?SM2为 de Gortari等 (1998)发表的绵羊基
因组第二代连锁图;
? SMC是一个以 SM2为框架,
– 用绵羊基因组中的 6号染色体 (Lord等, 1996)和 X
染色体 (Galloway等 1996)为基础计算预测整个绵
羊基因组的动态遗传连锁图 (dynamic linkage
map),它不断随着新基因和标记的增加而更新,
且比印刷版有更丰富的查阅功能 。 例如绵羊基因
组数据库中总位点数为 1260个, 其中基因位点 (I
型 )319个, DNA标记位点 (II型 )939个, 已定位到
SMC,SM1,SM2连锁图上的基因数 100,31,
39个, 标记位点数分别为 545,183和 471个 。 由
NCBI 接 受 承 认 的 绵 羊 (sheep) 核酸序列
(Nucleotide Sequence)为 1741个, 家绵羊 (Ovis
aries)的为 1339个 (1998年 11月 25日 )。
六、绵羊基因组物理图
?绵羊的 基因组物理图 进展速度始终落后于连
锁图的主要原因来自对绵羊基因组单个染色
体鉴定存在的难度较大, 而且作图技术单一 。
例如, 开始制作物理图时仅能用 体细胞杂交
方法将 I型基因确定到同源染色体上 (Fries等
1993)。 自 荧光原位杂交 (FISH)技术和 放射自
显杂交 (RH)作图技术应用于直接进行基因物
理定位开始, 到现在已能较容易地将 I型基
因和 II型标记位点从连锁图上转移定位到绵
羊的物理图上 。
FISH
?Womack(1997)报道定位到绵羊物理图上的 I型基因
位点数 400个, 大部分使用体细胞杂交 (SCH)技术确
证, 只有 50个 I型基因是用 FISH方法进行定位的 。
现在已经证实并定位到绵羊物理图上的基因位点有
458个 。 如绵羊的主要 BoLA-A(MHC-class I)编码基
因 (16个 )已定位到绵羊的物理图 23号染色体上 。 对
奶 绵 羊 业 极 为 重 要 的 酪 蛋 白 基 因 中 的
CSN1(casein,alpha),CSN2(casein,beta)等 9个基因
或基因束 (cluster)已分别被精确地定位到了绵羊的
基因组物理图 5(1),6(6),13(1)和 23(1)号染色体上 。
还有几个重要的绵羊遗传病基因也被在物理图上确
定了位置 。 例如奶绵羊中 WEAWER疾病基因已经
被定位到绵羊基因组第 13号染色体上 (Georges等
1993)。
七、展望
?制作高密度, 高分辨率的绵羊基因组图对于
分析控制绵羊重要 经济性状座位 (ETL,包
括 QTL)数量, 位置及它们对相应表现型影
响, 继而应用 标记辅助选择 (MAS)技术来实
现提高绵羊育种遗传进展速度和效益, 从而
创造更大的经济效益均具有十分重要的意义 。
?现在世界几个大的绵羊基因组项目随着作图
参考家系的完善, 遗传多态标记数量的不断
增加, 特别是政府资助强度的加大,
?例如, 欧共体绵羊基因组项目成员德国
ARD绵羊基因组分析项目的第二期投资强
度增加至近 300万 ERUO,约合 1千 5百万人
民币, 美国国家动物基因组项目 (NAGRP)
下一个五年计划 (98-03)中绵羊基因组项目
的投资占所有家畜种中第一位 )。 正在加紧
建立绵羊与不同种间的高分辨率比较图谱
及绵羊的基因组数据库系统及信息及资源
共享体系 。 绵羊基因组研究成果被应用于
育种实践和生产的距离越来越近 。
Bahn TierLID MarkerID Allel1 Allel2 1 WB0001 BM6458 97 105
1 WB0001 BM1224 134 138
1 WB0001 TGLA116 165 169
1 WB0001 RM068 174 174
1 WB0001 MAF50 226 238
2 WB0002 BM6458 105 113
2 WB0002 BM1224 132 140
2 WB0002 TGLA116 169 169
2 WB0002 RM068 180 186
2 WB0002 MAF50 224 226
3 WB0003 BM6458 97 113
3 WB0003 BM1224 138 140
3 WB0003 TGLA116 165 169 3 WB0003 RM068 174 186
3 WB0003 MAF50 224 226
血或其他组织
+
LKV BAY
H1G 4 003
00 191
TierLID_1
TierLID_3
TierLID_2
TierLID_4
DNA
PCR
基因型检测
ABI 310
基因型鉴定
凉山半细毛羊
第 1,2,3和 9
号染色体上 45
个微卫星标记
遗传图,用于
检测羊毛 QTL
7
6 10 4
6
27
27
8 4
1
32
2
2
3
7 2 38 NN15
.,
041
S19 S20 S28 S30
S47
S52 S53
S12 VS10
u
521
WB
733,,
761
M
471
S44 S46
S31
WB
735
u
215
u
861
u
593
u
020 u
617
u
583
84
100
.,
377
.,
893
S50
S49
W
216
.,
461
.,
347
S51 S45
M50
W
291
.,
391,,
693
.,
487
.,
844
S55
WB
1118
.,
001
W
203
WB
737
.,
536
WB
1152
S42 S41
WB
711
WB
545
M
481
.,
311
WB
615
.,
910
WB
800
u
240
S48
S43
.,
277 WB 828
.,
202 WB 683
WB
616
73
120
.,
469
.,
831
u
701
.,
504
.,
483,,091
S22
M
221
WB
823 M 231
WB
821
u
849 u 4459 WB 708
M
235
S13
S23
WB794
.,
694
.,
882
S21 S40
.,
126
M
142 S14
.,
462 WB 587
S54
.,
207
.,
032
WB614
WK
E76
S18
u
516
WB
733
u
521
WB
588
W
696
85
000
M
181
WB
1122
WB
538
WB
822
S24
S6
WB816
.,
262
S27 S15 S16 S29 S26
WB672
.,
620
WB790 M201 WB791
M
191
M
172
.,
346
WB
820
.,
530
.,
338 WB 610
WB
1112
WB
585
.,
604
.,
130
M
522
M
531
M
532
V
101,,880
M
441
.,
056
M
491
M
511
M
461
M
411
M
431
M
421
.,
609
.,
954
.,
835
.,
990
.,
093
ND
2
M
241
.,
414
WB
795
.,
155
u
693
.,
030
.,
470
.,
343
.,
135
S10
1
WB
1140
1
WB876
16
W297
14
WB583
.,
603
WB789 M151 M161
WB
819
.,
894
WB
1128
.,
344
.,
009
W
380
M
182