第
第
2章
章
基因组遗传图谱的制作
基因组遗传图谱的制作
2.1 遗传图谱与物理图谱
2.2 遗传作图的标记
2.3 遗传作图的原理
2.4 分子图谱的构建
2.1 遗传图谱与物理图谱
遗传图谱与物理图谱
为何要绘制遗传图与物理图?
?如果将每个碱基比作一个英文字母,以每10 cm书写60
个字母计算,人类基因组30亿个碱基其长度可达5000
千米相当于从北美洲的蒙特利尔横跨大西洋到达伦敦,
洛杉矶到达巴拿马
?以上述标准编写书籍,可写成3000本每册200万字的著
作
?即使简单的原核生物,以上述标准推算也足有1000千
米
基因组测序的策略
鸟枪法(shotgun method)
将基因组序列打断为小片段,对小片段进
行测序,通过计算机搜索重叠区从而构建主序
列,达到获得整个基因组序列的目的。
测序方法的局限:<750 bp
鸟枪法是获得较小的原核生物基因组序列的
标准方法,它不适用于分析较大的、复杂的真核
生物基因组。
对于真核生物基因组,首先需要建立起
一个基因组图(genome map),基因组图通
过显示DNA的位置特征为测序提供指导。
克隆重叠群法(clone contig)
直接鸟枪法(directed shotgun)
重叠群(contig):指相互间存在重叠顺序的一组
克隆。
克隆重叠群法(clone contig):基因组被打断为
许多片段,建立重叠群,对每一片段进行鸟枪法测
序,一旦测序完成,便可将其定位在基因组图上的
正确位置。
直接鸟枪法(directed shotgun):首先进行全基
因组鸟枪法测序,再以基因组图的分子标记为起点
将鸟枪法DNA片段进行组装。
标记
A B
A B HDED
AB
C D
E F
G H
ABC
D
E F
G H
已作图的DNA片段
全基因组
鸟枪法
重叠群法
直接鸟枪法
遗传图与物理图
遗传图与物理图
遗传作图(Genetic mapping)采用遗传学分析方
法将基因或其它DNA顺序标定在染色体上构建连
锁图。这一方法包括杂交实验,家系分析。遗传图
距单位为厘摩(cM), 每单位厘摩定义为1%交换率。
物理作图(Physical mapping)采用分子生物学
技术直接将DNA分子标记、基因或克隆标定在基
因组实际位置。物理图的距离依作图方法而异,如
辐射杂种(radiation hybrid)作图的计算单位为
厘镭(cR), 限制性片段作图与克隆作图的图距为
DNA的分子长度,即碱基对。
2.2 遗传作图的标记
遗传作图的标记
Setting flags on the genome
形态标记:指那些能够明确显示遗传多态性的
外观性状。如果蝇眼睛的颜色、植株的高矮等。
广义的形态标记那些借助简单测试即可识别的
某些形状如生理特性、抗病虫性等。
一个遗传形状必须以两种表型(phenotype)
存在才能用于遗传学分析,每种表型是由相应
基因的不同等位基因(allele)所决定的。
形态标记的不足:
?可以观察到的标记非常有限,难以建
立饱和的遗传图谱
?许多形态标记还受环境、生育期等因
素的影响
?形状的识别需要有相关的经验
细胞学标记:指能明确显示遗传多态性的
细胞学特征。
染色体的结构特征和数量特征是常见的细胞
学标记。
用具有染色体数目和结构变异的材料与染色
体正常的材料进行杂交,其后代常导致特定染色
体上的基因在减数分裂过程中的分离和重组发生
偏离,由此可以测定基因所在的染色体及其相对
位置。
?细胞学标记克服了形体标记易受环境
影响的缺点,但这种标记的产生需要
花费大量的人力物力进行培养选择。
?染色体变异对材料的影响较大,观察
和鉴定比较困难。
蛋白质标记
蛋白质标记
蛋白质的多态性,可能是由于基因编码的氨
基酸序列的差异引起的,也可能是由于蛋白质后
加工不同引起的,如糖基化能导致蛋白质分子量
的变化。
同工酶是指具有相同催化功能而结构及理化
性质又不同的一类酶,其结构的差异来源于基因
的差异,因此并不一定是同一基因的产物。
?蛋白质是基因表达的产物,与形态性状、细胞学特
征相比,数量上更丰富,受环境影响更小,能更好
地反映遗传多态性,已被广泛地应用于物种起源和
进化研究、种质鉴定、分类和抗病性筛选等领域。
?同工酶标记需要特殊的显色方法和技术
?某些酶的活性具有发育和组织特异性
?标记的数量还是比较有限
DNA标记
标记
DNA分子标记是DNA水平上遗传多态性的
直接反映,DNA水平的遗传多态性表现为核苷
酸序列的任何差异,哪怕是单个核苷酸的变异。
DNA标记的优点:
标记的优点:
?遗传多态性丰富
?共显性遗传,信息完整
?在基因组中大量存在且分布均匀
?稳定性、重现性好
?信息量大、分析效率高
?检测手段简单快捷,易于自动化
?成本较低
DNA标记种类
?限制性酶切片段长度多态性(RFLP)
?简单序列长度多态性(SSLP)
?单核苷酸多态性(SNP)
? RAPD标记、AFLP标记等
RFLP标记
标记
(Restriction Fragment Length Polymorphism)
RFLP即限制性片段长度多态性。这种
多态性是由于限制性内切酶酶切位点或位点
间DNA区段发生突变引起的。
RFLP
RFLP连锁图绘制
遗传图与RFLP连锁图
简单序列长度多态性(SSLP)
SSLP(Simple Sequence Length Polymorphism)是一
系列不同长度的重复序列,不同的等位基因含有不同
数目的重复单位。有两种类型:
小卫星(minisatellite)也称为可变数目的串联重复
(variable number of tandem repeat, VNTR)。重复
单位长度为几十个核苷酸;
微卫星或简单序列重复(simple sequence repeat, SSR)
它的重复单位较短,通常为二、三或四核苷酸单位,
重复次数一般为10-50
微卫星序列(SSR)
每个SSR座位两侧一般是相对保守的单拷贝序列
GAGAGAGAGAGAGAGAGAGA
GAGAGAGAGAGAGA
GAGAGAGAGAGAGAGAGAGAGAGAGAGA
A
B
C
AB
C
PCR
单核苷酸多态性
单核苷酸多态性
(Single Nuceotide Polymorphism, SNP)
基因组中存在单个碱基的突变,且数
量极大,这种单核苷酸的差异,可以最大
限度地揭示基因组的遗传多样性。
在人类基因组中平均每1.3 kb就有一个SNP存在。
SNP
鉴定
鉴定
SNP的主要途径有:
的主要途径有:
?在DNA测序的过程中,利用碱基的峰高和面积
的变化来监测单个核苷酸的改变引起的DNA多
态性
?通过对已有DNA序列进行分析比较来鉴定SNP
标记
?通过特异PCR引物扩增某个特定区域的DNA片
段,通过测序和遗传特征的比较来鉴定该DNA
片段是否可以作为SNP标记
?大规模的SNP鉴定可借助DNA芯片技术
其他
其他
DNA标记
标记
RAPD标记
(Random amplified polymorphism DNA)
采用9-10个碱基的随机引物进行PCR扩
增,检测基因组的多态性。
W1 M1
W1
引物结合位点突变1
引物结合位点突变2
插入突变
缺失突变
M1
W2 M2
W2
M2
W3 M3
W3
M3
W4 M4
W4
M4
RAPD标记的优点:DNA需要量极少,操作简
单易行。
不足之处:一般表现为显性遗传,不能区分显性
纯合和杂合基因型,因而提供的信息
不完整;
结果的重复性差。
可将RAPD标记片段从凝胶上回收并进行克
隆和测序,根据其碱基序列设计一对特异引物
(18-24bp左右)进行PCR扩增,将RAPD标记转
化为SCAR标记(Sequence Characterized
Amplified Region)。
AFLP标记:由Zabeau等(1993)发明
的一项DNA指纹技术。其基本原理是,
通过对基因组DNA酶切片段的选择性扩
增来检测DNA酶切片段长度的多态性。
GAATTC
CTTAAG
TTAA
AATT
AATTC
G
T
AAT
+EcoRI 和MseI
+EcoRI 接头和MseI接头
AATTCN
TTAAGN
NTA
NAT
预选择扩增,引物为EcoRI+A MseI+C
A
C
AATTCT
TTAAGA
CTA
GAT
AAC
AAC
CTA
GAT
AATTCT
TTAAGA
选择扩增,引物EcoRI+AAC MseI+CAA
变性凝胶电泳检测
主要类型的DNA分子标记的技术特点比较
中/较高少/中等少/较低少/较低多/高多/高耗时/成本
高高高
低/中等
高高可靠性
中等低低低中等高技术难度
2-5μg
25-
50ng
25-50ng10-25ng5-10μg2-10μgDNA用量
高中等低低高高
DNA质量
要求
特异引物
特异引
物
特异引物随机引物
DNA短
片段
特异性低
拷贝探针
探针/引物
类型
20-200多数为11-101-1010-1001-3
检测基因
座位数
较高高较高较高较高中等多态性
显性/共显性
共显性
显性/共显性
多数显性共显性共显性遗传特点
整个基因组
整个基
因组
整个基因组
整个基因
组
整个基
因组
低拷贝编
码序列
基因组分
布
AFLPSSRISSRRAPDVNTRRFLP
2.3 遗传作图的方法
遗传作图的方法
遗传连锁(genetic linkage)是遗传作图的基础
孟德尔遗传理论
等位基因随机分离:F1代的每个后代都有相同的机会
传递A或a等位基因
非等位基因的自由组合:位于不同座位的等位基因独
立遗传,遗传后代中自由组合
一个杂交试验的结果是可以预期的
局限性:
显隐性问题
不完全显性:杂合子表现为2个纯合子的中间表型
共显性:杂合子同时出现2个等位基因的表型
连锁遗传
当2个不同基因位于同一染色体上时,这2个基因往
往表现为连锁遗传
摩尔根发现了果蝇性状的部分连锁遗传
连锁遗传规律
假定有2个位于果蝇2号染色体上的基因分别为A
和B,它们各自的等位基因为a与b,这2对等位基
因在减数分裂分配到配子中有两种情况
两对基因之间不发生交换:产生2种配子,即AB、
ab
两对基因之间发生交换:产生4种配子,即AB、
ab、Ab、aB
同源染色体重组与交换
A与B之间发生交换的频率取决于A、
B在染色体上的距离,另外还与染色体结
构有关,但重组的配子数不会超过50%
部分连锁与遗传作图
部分连锁与遗传作图
如果染色体上任何位点发生交换的机会均
等,那么交换的频率随染色体上基因间距离的
增加而增大
重组型配子所占的比例取决于减数分裂细
胞中发生交换的频率
重组率(Recombination frequency):重组型
配子占总配子的比例,用r 表示
重组率的值变化于完全连锁时的0%到完全独立时的50%
之间,因此重组率可用来表示基因间的遗传图距,即基
因的遗传图谱。
遗传图距单位用(cebti-Morgan, cM)表示,1 cM的大小
大致符合1%的重组率。
果蝇基因连锁图绘制
遗传图的偏离
遗传图的偏离
?染色体各区段的交换频率有差别:如近端粒
区和远着丝粒区有较高的重组率
?重组热点(recombination hot spot)比其它
位点的交换频率高
?性别之间也会表现出重组频率的差异:一般
地,由女性减数分裂事件绘制的遗传图比男
性减数分裂事件绘制的遗传图长
?多次交换事件:2个基因间若发生多次交换,
则会产生遗传距离减小的假象
遗传图产生偏离?
但连锁分析给出的遗传标记在染色体
上的排列次序是准确的,它提供了基因
在染色体上的大致距离,为基因组测序
提供了工作框架。
不同生物的连锁分析
不同生物的连锁分析
有性杂交实验根据需要有计划地实施杂交方
案进行连锁分析,如果蝇、老鼠以及水稻玉米
等动植物的遗传学实验
系谱分析不能进行有计划的遗传实验,只能
收集家系成员的相关资料进行连锁分析,主要
涉及人类及多年生的树木等
DNA转移不发生减数分裂的生物,如细菌与
病毒基因组的连锁分析。
细菌遗传图绘制
转导
(transduction)
转化
(transformation)
接合转移
(conjugation)
转化(transformation ):供体细胞释放的一段DNA,
经受体细胞摄取后整合到基因组中,借助抗性培养基筛
选重组克隆
转导(transduction):以噬菌体为媒介,将长度可
达50 kb的DNA片段从供体细胞转移到受体细胞。
转导及转化的作图是依据所研究的基因是否同时出现在
受体细胞中,转移的DNA片段一般较短(<50 kb)
接合转移(conjugation):2个细菌机械接触,其中一个细
菌(供体)将DNA转移到另一个细菌(受体)中。
在接合作图中,供体DNA像一条细线顺次进入受体细胞。
根据野生型基因进入受体的时间表,可以确定基因所在
的位置。
2.4 分子图谱的构建
?选择适合作图的DNA标记
?根据遗传材料之间的DNA多态性,选择
用于建立作图群体的亲本组合
?建立分离群体
?测定群体中不同个体的标记基因型
?对标记基因型数据进行连锁分析,构建
标记连锁图
作图群体的建立
(一)亲本的选配
?考虑亲本间的DNA多态性
?尽量选用纯度高的材料,并进
一步通过自交进行纯化
?考虑杂交后代的可育性
分离群体类型的选择
暂时性分离群体:F2、F3、BC、三交群体等
永久性分离群体:RI、DH群体等
不同类型的分离群体,它们各有其优缺
点,应结合具体情况选用
Intercross
P1 P2X
F1
F1 X
F2
F2代群体
优点:
建立较容易,是常用的作图群体
缺点:
存在杂合基因型,对于显性标记,将无法识
别显性纯合基因型和杂合基因型
不易长期保存(无性繁殖保存;混合抽提F3
或F4家系DNA)
Backcross
P1 P2X
F1
P1 X
BC1
BC1(回交一代)群体
BC1群体中每一分离的基因座只有两种基因型,它直接
反映了F1代配子的分离比例,因而BC1群体的作图效率
较高
可用来检验雌雄配子在基因间的重组率上是否存在差异
(A×B)×A 雌配子中的重组率
A ×(A × B)雄配子中的重组率
缺点:
不能长期保存
人工杂交较困难的作物,不宜采用
RI群体
RI(重组自交系)群体是杂种后代经过多
代自交而产生的一种作图群体,通常从F2代开
始,采用单粒传的方法来建立。
RI群体中每个株系都是纯合的,因而RI群体
是一种可以长期使用的永久性分离群体。每一分
离座位上只存在两种基因型,且比例为1:1
在建立RI群体的过程中,两标记座位间每一代
都会发生重组,所以RI群体中的重组率是多代重
组率的累积。RI群体中的重组比例(R)与F1配子
中的重组率(r)的关系为:R=2r /(1+2r)
建立时间较长
DH群体
单倍体经过染色体加倍形成的二倍体称为
加倍单倍体或双单倍体(DH)
DH群体直接反映了F1配子中基因的分离和
重组,因此DH群体与BC1群体一样,作图效率
是最高的。
花培过程中不同基因型的花粉培养能力有差
异,从而破坏DH群体的遗传结构,造成较严重
的偏分离现象,影响遗传作图的准确性。
(二)群体大小的确定
一是从随机结果可以辨别的最大图距
二是两个标记间可以检测到重组的最小距离
作图群体大小还取决于所用群体的类型
为达到彼此相当的作图精度,所需的群体大小顺
序为F2>RI>BC1和DH
图谱制作的统计学原理
两点测验
对两个基因位点之间的连锁关系进行测验,称为两
点测验
两点测验的前提:各基因座位的等位基因分离是否
符合孟德尔分离比例
共显性:F2群体:1:2:1
BC1和DH群体:1:1
显性:F2群体:3:1
BC1和DH群体:1:1
两个连锁座位不同基因型出现的频率是估算重组值
的基础
最大似然法是以满足其估计值在观察结果中出现的
概率最大为条件,它可用于进行重组率的估计
若两座位间存在连锁,则r < 0.5;没有连锁,则r = 0.5
L()为似然函数,两种概率的似然比为L(r) / L(0.5) ,取以
10为底的对数,即为LOD值。
若确定两对基因之间存在连锁,一般要求似然比大于
1000:1,即LOD > 3;而要否定连锁的存在,则要求似然
比小于100:1,即LOD < 2
多点测验
在构建分子标记连锁图中,每条染色体上有许多的标记座位,
需要确定这些标记座位在染色体上的正确排列顺序及彼此间
的遗传图距
多点测验:同时对多个座位进行分析,利用座位间的共分离
信息来确定它们的排列顺序
多点测验也采用似然比检验法
先进行两点测验,根据两点测验的结果,将基因座分成不同
的连锁群,然后对各连锁群(染色体)上的座位进行多点连
锁分析
每次多点测验中,不能包含太多的位点,否则可能的排列数
非常大,计算时间很长。
交换干扰与作图函数
两个基因座之间可能发生双交换,由于存在交换干扰,
双交换的频率往往小于由单交换概率相乘所估得的理
论值。干扰程度用符合系数C表示
实际双交换值
理论双交换值
实际双交换值
r
1
r
2
=
C =
C = 0时,表示完全干扰,没有双交换发生;C = 1时,表示没
有干扰,两交换独立发生
如果忽略交换干扰,则由重组率估计出的图距会
比真实图距小。可通过作图函数来校正。
Haldane作图函数
假定C=1,图距x与重组率r之间的关系服从Haldane作图
函数x = -(1/2)ln(1-2r)
20%的重组率相当于图距为-(1/2)ln(1-2×0.20) = 0.255M,
即25.5 cM
Haldane作图函数的不合理之处是假定了完全没有交叉干
扰。考虑交叉干扰,双交换符合系数与重组率之间存在线
性关系,即C=2r。C值随r的增加而增加,干扰相应减弱,
当r=0.5(没有连锁)时,C=1(即没有干扰)
Kosambi作图函数
x = (1/4) ln
1+2r
1-2r
r = 0.2时,x=21.2 cM,Kosambi作图函数算出的图距离
比Haldane作图函数的小。Kosambi作图函数比Haldane
作图函数更合理,它的应用更广泛。
DNA标记分离数据的数学处理
分离数据的收集与数字化
从分离群体中收集分子标记的分离数据,获得不同个
体的DNA多态性信息。通常各种DNA标记的基因型的
表现形式是电泳带型,将电泳带型数字化是DNA标记
分离数据处理的关键。
P1 P2 1 2 3 4 5 6 7 8 9
M1
121 2 3 2 3 2 1 3 0
F2群体中RFLP标记的数字化
共显性标记共有4种类型:即P1型、P2型、F1型和缺失数据,可用
4个数字1、2、3和0分别表示
对于显性标记,还有两种情况:P1对P2显性,P1型和F1型作为一
种类型,可计为4;另一种情况是P2对P1显性,则P2型和F1型作为
一种类型,可计为5
对于BC1、DH和RI群体,每个分离的基因座都只有两种基因型,
不论显性还是共显性标记,两种基因型都可以识别
质量性状基因的表型数字化
?在分析质量性状基因与遗传标记之间的连锁
关系时,也必须将有关的表型数字化。
?将质量性状经过数字化处理后,可与DNA标
记数据放在一起进行连锁分析。
DNA标记数据的收集和处理应注意的问题
?避免没有把握的数据
?对亲本基因型的赋值,在所有标记座位上
必须统一,不能混淆
?当亲本出现多条带的差异时,应通过共分
离分析鉴别这些带属于同一座位还是不同
座位,如属于不同座位,应逐带记录分离
数据
P1 P2 1 2 3 4 5 6 7 8 9
121 2 3 2 3 2 1 3 0
P1 P2 1 2 3 4 5 6 7 8 9
1
0
0
0
2
2
1
2
0
0
0
2
1
2
0
1
0
2
1
0
2
0
2
2
1
2
0
1
0
2
0
0
0
构建DNA标记图谱的计算机软件
常用软件有:LINKAGE、MAPMAKER/EXP等
LINKAGE软件是利用最大似然法估计两座位
或多座位间的重组率和LOD值
MAPMAKER/EXP软件可应用于各种类型的
实验群体进行遗传作图,是目前应用最为广
泛的作图软件之一
饱和DNA标记连锁图的制作
遗传图谱饱和度是指单位长度染色体上已定位的标记数或
标记在染色体上的密度
?一个基本的DNA标记连锁图要求染色体上的标记平
均间隔不大于20 cM
?若用于主基因的定位,平均间隔要求在10~20 cM
或更小
?用于QTL定位的连锁图,其标记的平均间隔要求在
10 cM以下
?利用连锁图谱进行基因克隆,则要求目标区域标记
的平均间隔在1cM以下
遗传图谱达到特定饱和度所需的标记数
300010005000300066000.5cM
15005002500150033001cM
3001005003006605cM
1505025015033010cM
75251257516520cM
图谱饱和度
47314010003001000kb/cM
1500500250015003300cM
7.1×10
5
7.0×10
4
2.5×10
6
4.5×10
5
3.3×10
6
kb
基因组大小
番茄拟南芥玉米水稻人类
生物
比较作图(comparative mapping)
?利用一种物种的DNA标记对另一物种进行
遗传或物理作图
?分子基础是物种间DNA序列尤其是编码序
列的保守性
?比较作图可揭示不同物种基因组或基因组
区域同线性或共线性的存在,从而了解不
同物种基因组结构的相似性及基因组的进
化的历程
同线性:指定位在一个物种的染色体上的两个或多个标
记又被定位于另一物种的同源染色体区域上,但这些标
记间的相对顺序可以变化
共线性:指定位在同源染色体上的标记,且标记间的相
对顺序是保守的。
9比较作图研究可显著增加各物种中可供利用的遗传标
记的数量
9定位近缘物种的染色体同源区域相同的基因,提高基
因定位的效率
9借助基因组测序信息,对基因组比较分析,可深入了
解生物的遗传本质
质量性状基因的定位
?近等基因系(Near-isogenic lines, NIL)
分析法
?分组混合分析法(Bulked segregant
analysis, BSA)
×
×
×
×
×
近等基因系培育示意图
供体亲本轮回亲本
近等基因系分析法的基本原理
比较轮回亲本、NIL及供体亲本三者的
标记基因型,当NIL与供体亲本具有相同的
标记基因型,但与轮回亲本的标记基因型
不同时,则该标记可能与目标基因连锁。
L1
L2
L3
L4
Chr.1 Chr.2
R
R
近等基因系NIL
L1
L2
L3
L4
Chr.1 Chr.2
r r
轮回亲本B
NIL B
NIL B NIL B NIL B
L1 L2 L3 L4
分子标记分析
分组混合分析法(Bulked segregant analysis, BSA)
基于性状表现型的BSA法
?根据目标性状的表现型对分离群体进行分组混合。
?将个体或株系依据相对表型差异分成两组,形成各
自的DNA混合池。这两个DNA池之间除了除了在
目标基因座所在的染色体区域存在差异外,来自基
因组其他部分的DNA组成完全相同,都是该作图
群体基因库的一个随机样本
?在这两个DNA池间表现出多态性的DNA
标记,有可能与目标基因连锁
?用BSA获得连锁标记后,利用其在群体
上的分离比,估计出标记与目标基因间
的图距
基于标记基因型的BSA法
?根据目标基因两侧的分子标记的基因型
对分离群体进行分组混合
?适合于目标基因已定位在分子连锁图上,
需要进一步寻找于目标基因更为紧密的
分子标记的情况
A
1
B
1
A
2
B
2
P1 P2
A
B
分离群体(如F2)
A
1
B
1
/A
1
B
1
A
2
B
2
/A
2
B
2
依据基因型A
1
B
1
/A
1
B
1
和A
2
B
2
/A
2
B
2
构建DNA混合池,它们只
是在目标区段上存在差异,目标区段以外的遗传背景相同
寻找两DNA混合池之间的多态型,有可能在目标区段上找到
与目标基因紧密连锁的分子标记。
?近等基因系分析法和分组混合群体法只能对目标
基因进行分子标记(molecular tagging),还不
能确定目标基因与分子标记间连锁的紧密程度及
其在遗传图谱上的位置,而这些信息对利用标记
辅助选择和克隆目标基因具有重要价值
?获得与目标基因紧密连锁的分子标记后,还必须
利用作图群体进一步确定目标基因在分子连锁图
上的位置
数量性状基因的定位
数量性状受多基因控制,遗传基础复杂,且易受环境影
响,表现为连续变异,表现型与基因型没有明确的对应
关系
控制数量性状的基因在基因组中的位置称为数量性状基
因位点(QTL)
利用分子标记进行遗传连锁分析,检测出QTL,称为
QTL定位
QTL定位的基本原理和方法
QTL定位实质上就是分析分子标记与QTL之间的连锁
关系,其基本原理仍然是对个体进行分组,但这种分
组是不完全的。
根据个体分组依据的不同,现有的QTL定位方法可以
分为两大类:
?以数量性状表型为依据进行分组,称为基于性
状的分析法
?以标记基因型为依据进行分组的,称为基于标
记的分析法
基于性状的分析法(Trait-based analysis)
原理
将高值和低值两种极端表型的个体分开成两组,对每
个QTL而言,在高值表型组中应存在较多的高值基因型
(如QQ),而低值组中应存在较多的低值基因型(如
qq)。如果某个标记与QTL有连锁,那么该标记与QTL之
间就会发生一定程度的共分离,于是其基因型分离比例
(频率分布)在两组中都会偏离孟德尔规律。用卡方测验
对两组或其中一组检验这种偏离,就能推断该标记是否与
QTL连锁
MQ
MQ
mq
mq
P1 P2
MQ
mq
×
DH
F1
减数分裂染色体加倍
低值极端表型个体
高值极端表型个体
QQ比qq少
MM比mm少
QQ比qq多
MM比mm多
亲本2亲本1低值组高值组
mm
MM
优点:
?需要检测的DNA样品数量少,降低分子标记
分析的费用
缺点:
?只能用于单个性状的QTL定位,且灵敏度和
精确度都较低,一般只能检测出效应较大的
QTL
基于性状的分析法应用得不多,主要还是
采用基于标记的分析法
基于标记的分析法(Marker-based analysis)
原理
如果某个标记与某个QTL连锁,那么在杂交后
代中,该标记与QTL之间就会发生一定程度的共分
离,于是,在该标记的不同基因型之间,在数量性
状的分布、均值和方差上都存在差异。通过检验标
记的不同基因型之间的这些差异来推测标记是否与
QTL连锁
MQ
MQ
mq
mq
P1 P2
×
F1
DH
MQ
MQ
Mq
Mq
mQ
mQ
mq
mq
(1-r)/2(1-r)/2
r/2 r/2
mm
MM
(1-r)μ
QQ
+ rμ
qq
rμ
QQ
+ (1-r) μ
qq
仅当r=0.5(即标记与QTL间没有连锁)时,QQ和qq在MM和mm 中的
频率分布才相同
根据所采用的统计遗传模型,现有的基于标
记的分析方法可分为四类
?均值差检验法
?性状-标记回归法
?性状-QTL回归法
?性状-QTL-标记回归法
均值差检验法
基本思想是检验同一标记座位上不同基因型间数量性
状均值的差异,若差异显著,则表明被检验标记与
QTL连锁
以DH群体为例,当某个标记与一个QTL连锁时,两
种标记基因型(MM和mm)的性状均值分别为:
μ
MM
= (1-r)μ
QQ
+ rμ
qq
μ
mm
= rμ
QQ
+ (1-r) μ
qq
当r=0.5,即标记与QTL没有连锁时
μ
MM
= μ
mm
= 1/2(μ
QQ
+ μ
qq
)
?只要r<0.5,即标记与QTL间存在连锁,则μ
MM
≠μ
mm
? r值越小,标记与QTL间连锁越紧密,μ
MM
与μ
mm
之
间的差异越大
?当r=0,即标记与QTL间完全连锁,则μ
MM
与μ
mm
间的
差异最大,μ
MM
- μ
mm
= μ
QQ
- μ
qq
因此,用t测验方法检验两种标记基因型间的数量性状表型
差异是否显著,就可推断该标记是否与QTL连锁。t值越
大,显著性越高,则连锁越紧密。
对于F2群体,存在3种标记基因型的性状均值,即
μ
MM
= (1-r)
2
μ
QQ
+2r(1-r)μ
Q
q
+ r
2
μ
qq
μ
M
m
= r(1-r)μ
QQ
+ [1-2r(1-r)]μ
Q
q
+ r(1-r) μ
qq
μ
mm
= r
2
μ
QQ
+2r(1-r)μ
Q
q
+ (1-r)
2
μ
qq
?用单因素方差分析法检验3种标记基因型间的性状均
值差异是否显著,就可推知该标记是否与QTL连锁。
? F测验得到的F值越大,即差异越显著,标记与QTL
间连锁越紧密。
单标记均值差检验法的优点是简单直观
缺点
?检测QTL的灵敏度较低,不能具体定位
?不适用于一条染色体上存在多个QTL的情形
?仅用于对数据的初步分析
QTL定位的计算机软件:
Mapmaker/QTL
分子标记辅助选择
(Marker-assisted selection, MAS)
如果目标基因与某个分子标记紧密连锁,通
过对分子标记基因型的检测,就可获知目标基因
的基因型。这种借助分子标记对目标型状的基因
型选择,称为标记辅助选择(MAS)。
分子标记辅助选择的优点
?表现型检测有些较困难、有些费用较高、检测
存在误差,而分子标记检测较稳定方便
?分子标记可实现在个体发育的早期检测和选择
?分子标记检测可实现程序化,检测的样本较多
?分子标记不仅可检测目的基因,还可对基因组
的其他部分(遗传背景)进行选择
分子标记辅助选择的基本方法
前景选择(foreground selection)
对目标基因的选择,前景选择的可靠性主要取
决于标记与目标基因间连锁的紧密程度
背景选择(background selection)
对遗传背景的选择。背景选择的对象是除了
目标基因以外的整个基因组,需要有一张完整的分
子标记连锁图。
分子标记辅助选择的应用
基因聚合(gene pyramiding)
将分散在不同品种中的有用基因聚合到同一个基
因组中
基因转移(gene transfer)
又称基因渗入(gene transgression),将供体亲
本中的有用基因(目标基因)转移或渗入到受体亲本
的遗传背景中,从而达到改良受体亲本的个别性状的
目的