第十七章 群体遗传
学习要点:
1,名词概念:
孟德尔群体、基因库、基因频率、基因型频率、适应值、
选择系数、迁移、遗传漂变、多态性、杂合度、物种,
2,Hardy-Weinberg定律及其应用。
3,影响 Hardy-Weinberg定律的因素及机理。
4,遗传多态性。
5,物种的形成及其遗传学基础。
6,分子进化的中性学说。
第一节 群体的遗传结构
一、孟德尔群体和基因库
1,孟德尔群体 (- population):一群相互交配的个体组成
的群体.
2,基因库 (gene pool),群体中所有个体共有的全部基
因.
二、群体的遗传结构
1,基因频率 (gene frequency),一个二倍体中某基因座
位上,某一等位基因在该位点所有等位基因中所占的比
率。
2,基因型频率 (geotype frequency):群体中特定类型的
基因型个体的数目,占个体总数目的比率。
设:在N个个体的群体中,在常染色体有一对等位基因A、
a,其可能的基因型为,AA,Aa,aa。
如果群体有 n1AA+ n2Aa+ n3aa个体,n1+ n2+ n3=N,
于是此 3种基因型的频率为:
AA,D= n1/N Aa,H=n2/N aa,R=n3/N
∵ D+H+R=1,D— 显性; H— 杂合; R— 隐性,
∴ 等位基因 A的频率为 p=(2n1+n2)/2N=D+H/2‥‥ ①
同理,等位基因 a的频率 q=(2n3+n2)/2N=R+H/2 ‥ ②
所以 p+q=1.同时公式反映出了基因频率与基因型频率的关
系。
例,P462 1)中国汉族人群中 PTC尝味能力分布 。
2) MN血型在中国人中的分布
第二节 随机交配的大群体
一、随机交配
1,概念:在有性生殖的生物中,一种性别的任何一个个
体有同样的机会和另一性别的个体交配的方式。
2,例如:一对等位基因,三种基因型 AA(D),Aa(H),aa
(R) 之间的随机交配,不同交配类型及频率,
(D+H+R)2=(D2+H2+R2+2DH+2DR+2HR)=1
二,Hardy-Weinberg定律
1908年 [英 ]Hardy,[德 ]Weinberg分别独立发现,
1,Hardy-Weinberg定律, 又称为基因型频率的平衡定
律,当一个大的孟德尔群体中的个体间进行 随机交配,
同时 没有选择、没有突变、没有迁移和遗传漂变 发生,
下一代基因型频率将和前一代基因型频率一样,于是这
个群体被称为处于随机交配系统下的平衡中。
2,分析,设常染色体上的一对等位基因 A和 a的频率分别
为 p和 q,且 p+q=1,随机交配的三种基因型:
♀ p A q a
♂ p A p2 pq
q a pq q2
基因型频率,AA:D=p2; Aa:H=2pq; aa:R=q2
设没有选择、突变、迁移、漂变等影响,其各种基因型随
机结合,产生的子代的基因型频率仍然为:
AA:P2=D Aa:2pq=H aa:q2=R
—— 群体基因型平衡
3,举例,随机交配大群体常染色体等位基因 A,a,三种
基因型 (原代 ):
AA D0 0.18
Aa H0 0.04
aa R0 o.78
则基因频率,p0= D0+(1/2)H0=0.18+0.02=0.20
q0= R0+(1/2)H0=0.02+0.78=0.80
随机交配 ♀ 0.20 (A) 0.80 (a)
♂ 0.20 (A) 0.04(AA) 0.16 (Aa)
0.80 (a) 0.16(Aa) 0.64(aa)
则 AA:p2= 0.04 Aa:2pq=0.32 aa:q2=0.64
子代与原代基因型频率不同。但基因频率一致,
p1=0.04+(1/2)0.32=p02+(1/2)(2p0q0)=P0
q1=0.64+(1/20.32)=q02+(1/2)(2p0q0)=q0
让子代再随机交配:
随机交配 ♀ 0.20 (A) 0.80 (a)
♂ 0.20 (A) 0.04(AA) 0.16 (Aa)
0.80 (a) 0.16(Aa) 0.64(aa)
则 AA:p2= 0.04 Aa:2pq=0.32 aa:q2=0.64与子一代相同
4,Hardy-Weinberg定律的要点:
① 若没有突变、选择、迁移、漂变等的影响,群体的
基因频率世代保持不变。
② 无论群体的起始基因型频率如何,经过一个世代的
随机交配后,群体基因型的频率达到平衡。平衡群体
的基因型频率的值取决于基因频率的值,即:
(pA+qa)2=p2(AA)+2pq(Aa)+q2(aa)
③ 只要系统保持随机交配,基因型频率的值始终保持
不变。
二,平衡群体的一些基本性质
(1)二倍体群体中,杂合体的比例只有当 p=q=1/2
时达到最大;
推导, p+q=1 ? (p+q)2=1 ? (p2+q2-2pq)+4pq=1
? 4pq=1-(p-q)2 ? 当 p-q=0,即 p=q=0.5时,2pq
有最大值,2pq=1/2=0.5
(2)杂合体的频率是两个纯合体频率的乘积的方根
的两倍;
推导, H=2p× q=2?p2× q2= 2?D× H
或者,H2=4DR 或 H/ ?D× H=2,可用于验证
群体是否达到平衡。
(3)群体点在齐次坐标中的运动轨迹为一个抛物线
H2=4DR;
∵ [D+H+R=1为定值 (坐标系中等边三角形的高 )]
平衡群体在齐次坐标系中为抛物线 H2=4DR。
(4)平衡群体中 Aa× Aa交配的频率为 AA × aa交
配频率的两倍。
Aa× Aa=H2=(2pq)2=2(2p2q2)=2(2DR)=2(AA× aa)
(5)如果 q→0 则 p→1 而 q2 →0, 因此:
R≈0 H=2pq≈2q D≈1-2q
说明:一个群体中一个隐性基因的频率 q很低,
则隐性纯合体基因型的频率 q2更低。
** 隐性基因绝大多数处于杂合状态。
eg,尿黑酸尿症发病率 q2=10-6,
?隐性基因频率 q=10-3,
?群体中杂合体的频率 H≈2q=2× 10-3.
四、平衡定律的推广
1.常染色体复等位基因的平衡
如果常染色体一个基因位点有 3个等位基因 A,a’,a
在群体中遗传,其频率分别为 p,q,r且 p+q+r=1。
平衡时,(A a’ a)2=AA Aa’ Aa a’a’ aa’ aa
p q r p2 2pq 2pr q2 2qr r2
即,(p+q+r)2 =p2 + 2pq + 2pr + q2 + 2qr + r2
基因频率可以由基因型频率求得:
P=p2+(2pq+2pr)/2;
q=q2+(2pq+2qr)/2;
r=r2+(2pr+2qr)/2
例如,果蝇 D,willistoni的 Lap-5基因的座位上有三个复等
位基因,98”,100”,103” 。
如若群体中有 k个复等位基因:
有 k个复等位基因 A1,A2,…A i,… A k
相应的基因频率 p1,p2,…p i,… p k
基因频率与基因型频率的关系:
(∑piAi)2= ∑pi2AiAi+2 ∑pipjAiAj (0<i,j?k,其中 i<j)
其中 AiAi 表示纯合体,共有 k种; AiAj 为杂合子,有 k(k-1)/2种。

♀ p1 (A1) p2 (A2) p3 (A3) p4 (A4)
p1 (A1) p1 2 (A1A1) p1p2 (A1A2) p1 p3 (A1A3) p1p4 (A1A4)
p2 (A2) p1p2 (A1A2) p2 2 (A2A2) p2p3(A2A3) p2p4(A2A4)
p3 (A3) p1 p3(A1A3) p2p3(A2A3) p3 2 (A3A3) p3 p4(A3A4)
p4 (A4) p1p4 (A1A4) p2 p4(A2A4) p3 p4(A3A4) p4 2 (A4A4)
i=1
k
例子, 人类的 ABO血型。说明平衡群体中 3个复等位基因 IA
IB i 基因频率的计算和平衡的检验。
设复等位基因 IA IB i 的频率分别为 p,q,r 。 平衡
群体中其表表型、基因型及其频率有:
基因频率,i r= √O
IB q=1-(p+r) =1-√(p2+2pr+r2)=1-√A+O
IA p=1-(q+r) =1-√(q2+2qr+r2)=1-√B+O
判断群体是否达到平衡,具体事例:
r=√O=√0.30766= 0.55486
q=1-(√A+O) =1-(√0.32000+0.30766) = 0.20594
p=1-(√B+O) =1-(√0.27116+0.30766) = 0.22392
实际结果需要作 ?2检验
2.伴性基因的平衡
遗传平衡定律也适用于性连锁基因。
Ⅰ, 判定在 X染色体上等位基因达到平衡的标准:
在随机交配条件下,下列情况达到了 H-W平衡:
雄体 雌体
XA Xa 和 XAXA XAXa XaXa
p q p2 2pq q2
或者雌雄群体基因频率相等。
Ⅱ, X染色体上等位基因由不平衡到平衡的方式和
途径:
**不平衡群体经过多个世代的随机交配,振荡的
方式快速地接近平衡。
1.每随机交配一次,雌雄群体中基因频率的差值
减少一半
d=qxx - qx= -(q`xx -q`x)/2= -d`/2
2,所以 px与 pxx间的差异越大,实现平衡的时间
就越长;反之则短。
3,在建立平衡的过程中,雌雄两性群体中的基
因频率随着随机交配世代的增加而 交互递减 。
Ⅲ,经过随机交配群体达到平衡以后,基因的频率分别为:
a基因,q=(qx+2qxx)/3=(q`x+2q`xx)/3=常数
A基因,p= (px+2pxx)/3=(p`x+2p`xx)/3=常数
? qxx-q=-(q`xx- q)/2; qx -q= -(q`x-q)/2
原因:伴性遗传基因以振荡式接近平衡点的性质,是
由于雄体和雌体的性染色体组成不同,群体中伴性基因
有 2/3存在于雌体中,1/3存在于雄体中。
例子, 求色盲基因频率,根据男性群体的某调查结果发
现其色盲的患者为 7%,既表示 qx=qxx=0.07,预期女性中
有 q2=(0.07)2=0.49%
隐性伴性遗传,[ 男性发病率,女性发病率 =q:q2=1:q ]
显性伴 X遗传,[男性,女性发病率 =p,(p2+2pq)=1:(1+q) ]
第三节 影响 Hardy-Weinberg平衡的因素
一、基因突变
( 1) 仅考虑没有选择压力的正向突变:
设基因 A→a 突变,每代突变率 u
( u=x/n,x是一代中 A突变为 a基因数目,n为 A基因总数)
突变前 A 频率, p
突变后 A 频率,p(1- u)
突变压 (mutation pressure),突变所造成的群体中基
因频率改变的度量(由 pu来反映)。
如果突变压逐代增加,则基因 A将在群体中逐渐消失,
∵ pn=p0(1- u )n (n→ ∝ ; pn →0 )
如果突变不受其他基因的阻碍而无限地持续下去,A
的频率最终将减少到零而达到纯合的 a。
( 2) 设同时存在回复突变,回复突变频率为 v,
群体中 A,a的频率分别为 p和 q,则经过一代突变后:
A,p-pu+qv; a,q-qv+pu
基因频率的变化值:
A,Δp=(p-pu+qv)-p=-pu+qv;
a,Δq=(q-qv+pu)-q= -qv+pu
经过足够多的世代,两种力量达到平衡,Δp=Δq=0
Δp= -pu+qv = -(1-q)u+qv=0,? (u+v)q=u
则 q=u/(u+v) 同理 p=v/(u+v)
说明,平衡时基因的频率只决定于正反两个基因的突
变率,而与两个基因各自的起始频率无关。
另外,Δp=-(1-q)u+qv=-u+q(u+v)=-[q(u+v)]+q(u+v)
=(u+v)(q-q)
当 q > q,Δp>0,A基因增加,同时 a基因减少
当 q < q,Δp<0,A基因减少,a基因增加
举例:
设一对等位基因 A,a,u=1.5× 10-6,v=1× 10-6
则平衡时 a,q=u/(u+v)=0.6;
A,p=v/(u+v)=0.4
表示在突变压的作用下,平衡时
A 基因的频率为 40%; a基因的频率为 60%
若 u=v则平衡时
A基因频率为 50%,a基因的频率也为 5%。
二、自然选择
1.适应值 (adaptive value):
也称达尔文的适合度,指一种已知基因型的个体,
将它的基因传递给后代的相对能力,用 ω表示。
解释, ① ω为一个相对值,一般将具有最高生殖效能的
基 因型个体的适应值定为 1,其它基因型个体与之相比
的比值来表示。如:不同遗传病患者的适合度。
② 适合度是一个相对概念,与环境因素有关。例如,
椒花蛾在污染区时 (浅色容易被淘汰 ):
在非污染区时(黑色容易被淘汰):
2.选择系数:
一种基因型的个体在群体中不利于生存的程度,用 S
表示。 其中 S=1-ω,显然 ω=1时,S=0; ω=0时,S=1.
3.选择对隐性纯合体的作用。
(1)对隐性纯合体的不完全选择,即 0﹤ S﹤ 1.
设一对等位基因 A和 a,频率分别为 p,q,处于平衡状态,则基
因型频率为,AA,p2; Aa,2pq; aa,q2 和为 1
设 AA和 Aa 的 ω=1,而 aa的 ω=1-S,则选择前后基因型的频率分
别为:
经过选择后下一代的基因频率分别为:
A,p1=(p2+pq)/(1-Sq2)
a,q1=[pq+q2(1-S)]/(1-Sq2)=[q(1-Sq)]/(1-Sq2)
a基因的频率改变量:
Δq= q1-q=q(1-Sq)/(1-Sq2)-q=-Sq2(1-q)/(1-Sq2)
q很小时, 1- Sq2≈1,则 Δq≈ -Sq2(1-q)
(2)对隐性纯合体的完全选择,即 S=1:
经过一代选择后,A和 a基因的频率为:
A,p1=(p02+ p0q0)/ (p02+2p0q0)= (p0+q0)/(1+q0)=1/(1+ q0)
a,q1=[2(p0q0)/(p02+2p0q0)]/2=q0/(1+q0)
? ∴ qn+1 = qn /(1+ qn) 可以递推 ? qn = q0 /(1+ nq0)
即 n=(1/qn)-(1/q0),当 qn =q0/2时,n=1/q0
表示, 隐性基因减少一半时的世代数为初始基因频率的倒数。
举例, 已知人类白化病等位基因的频率为 0.01,若白化纯
合体不育( S=1),要将此基因的频率分别降至 0.001和
0.0001所需的世代数。
利用 n=(1/qn)-(1/q0)计算,
n=(1/0.001)-(1/0.01)=900
n=(1/0.0001)-(1/0.01)=9900
3.对显性体的选择:
经过一个世代的选择后,A和 a基因的频率分别为:
A,p1=[p2(1-S)+pq(1-S)]/[1-Sp(2-p)]=(1-S)p/ [1-Sp(2-p)]
a,q1=[q2+pq(1-S)/[1-Sp(2-p)]=q(1-pS)/[1-Sp(2-p)]
∴ Δp=p(1-S)/[1-Sp(2-p)]-p=-Sp(1-p)2/[1-Sp(2-p)]
当 S很小时,分母约为 1,Δp≈-Sp(1-p)2
三、突变与选择联合作用下的群体平衡
突变和选择可以在一个群体中同时起作用。若同向施压,
使基因改变频率加快;若反向施压,最终会达到平衡。
1.选择隐性纯合体,
设一对等位基因 A和 a(频率分别为 p,q),正向突变频率
u,回复突变频率 v,同时选择系数 S作用于 aa。
则突变使 a增加频率为,Δq1=-qv+pu=u(1-q)-vq
选择使 a减少频率为,Δq2=-Sq2(1-q)/(1-Sq2)≈-Sq2(1-q)
(注, q很小时作近似处理,即 1-Sq2 ≈1)
平衡时,u(1-q)-vq= Sq2(1-q) [即 Δ q1 +Δ q2 = 0]
若 v也很小,vq≈0,则 u ≈ Sq2,q=√u/S
可用于推算自发突变的频率 u或平衡时 q:
举例:
例一,人类全色盲为常染色体,隐性纯合体的比例为 8万
分之 1,并且色盲的子女为正常人的一半,求正向突变频率,
解, q2=1/80000,S=0.5,则 u=Sq2=6.25× 10-6
例二,若 u=0.000018,S=0.02,则 q2=u/S=0.0009,q=0.03
2,选择的是显性纯合体:同样 v=Sp2.
3,选择显性体( AA和 Aa)
选择 Δ p1=-Sp(1-p)2; 突变 Δ p2=qv=v(1-p); 平衡 ?=0
Sp(1-p)2 =v(1-p) ?当 p很小时,1-p≈1,所以 v=Sp
例如,人类侏儒 (AA,Aa),适应值 ω=0.2,正常 a突变
为 A的频率 v=5 × 10-5,求 A基因的频率。
解,S=1-ω=0.8,v= 5 × 10-5,则
p=v/S=6.25× 10-5 杂合体 H=2pq≈2p=1.25× 10-4
四、迁移
1.概念:
迁移 (migration):只指群体中有个体的迁入或迁出 (生殖
前 ),导致群体中基因的频率发生改变。
2.分析, 两个 群体甲、乙,一对等位基因 A和 a:
甲,A,p; a,q (甲为大群体 )
乙,A,p0; a,q0 (乙为小群体 )
迁移,甲 → 乙 ; 同时乙 → 甲和其它,迁移率均为 m,分析
群体乙 中 a 基因。
那么经过一个世代后,群体乙中 a的频率为:
q1=q0-mq0+mq = mq+q0(1-m)
则 Δq=q1-q0=m(q-q0)
那么 q1-q=[q0+m(q-q0)]-q=(1-m)(q0-q)
说明, ①迁移使甲乙群体中的 a基因的频率差距缩小;
② m恒定,q=q0时群体平衡,迁移不影响基因频率。
若每个世代 m不变,大群体甲迁移后 q不变。则
q2=mq+q1(1-m)=mq+[mq+q0(1-m)](1-m)
=mq+mq (1-m) +q0(1-m)2
可以类推:
qn=mq+mq(1-m) +mq(1-m)2+…+mq(1 -m)n-1+q0
(1-m)n
前 n项之和
Sn=mq[1-(1-m)n]/[1-(1-m)]=q-q(1-m)n
故连续迁移 n代后群体乙中 a基因的频率
qn=[q-q(1-m)n]+(1-m)nq0 = q+(1-m)n(q0-q)
所以 (1-m)n=(qn-q)/(q0-q)
*可用于计算群体的迁移率。
举例:
两个群体 A,B,
大群体 A中 Rh血型的 R基因频率 p=0.028,
小群体 B中 Rh血型的 R基因频率 P0=0.630,
B群体与 A群体基因有迁移 10代后,Pn=0.446。 求
R基因迁移的频率。
解, (1-m)n=(pn-p)/(p0-p)
则 (1-m)10=(0.446-0.028)/(0.630-0.028)
可得 m=1- 10√0.694
= 0.036
注,迁移对大群体基因频率影响不大,可以忽略。
五、随机的遗传漂变
一、定义:
遗传漂变 (random genetic drift):一个小群体中,由于
偶然事件导致群体中基因频率的改变 (Wright effect)。
二、特点:
1,遗传漂变与抽取的样本数有关,样本数越小基因频
率的波动越大,样本数越大基因频率的波动越小;
2.环境条件的改变可能造成遗传漂变。环境使原来群
体的部分隔离,造成基因频率的改变,
三、奠基者效应 (founder effect)和瓶颈效应 (bottle effect)
A,奠基者效应, 由少数几个个体的基因频率,决定后
代的基因频率,
B,瓶颈效应, 一个大的群体通过瓶颈后,由少数几个
个体再扩展成原来原来规模的群体,群体数量消长的过
程对遗传造成的影响。
第四节 自然群体中的遗传多态性
一、多态性和杂合性
遗传多态性 (genetic polymorphism),一个物种的
同一群体中存在两种或两种以上变异类型的现象。
例如,检测一个海蠕虫群体中的 30个基因座,其中
有 18个有多态性,多态性频率 60%。
多个群体的平均多态性:
检测的各群体相同基因座多态性频率之和
群体的总数=
杂合性 (heterozygosity),指群体中,平均每个基因
座位都是杂合状态的比率,或者称为群体的平均
杂合性,
每个基因座都为杂合子的频率的总和
基因座的总数H=
二、染色体多态性
染色体多态性,是染色体的结构或数目差异造成的
群体内或群体之间染色体 (核型 )的差别,
例如,果蝇
核型 (karyotype),将一个二倍体的物种的染色体
按长度、着丝点的位置、次缢痕等等参数,依次
排列形成的染色体图谱。
三、蛋白质的多态性
蛋白质多态性,由于基因的结构变异造成构成蛋
白质氨基酸的组成和数目发生变化,使蛋白质呈
现多态性分布。
例如,镰刀红细胞多态性,由 HbA,HbS,HbC,HbE
等蛋白基因序列的差异造成。
四,DNA序列多态性
? DNA序列多态性,由于 DNA核苷酸组成或排列顺
序的改变使群体之间或者群体内部的个体之间出
现 DNA的多态性分布,
1,限制性片段长度多态 (RFLP),基因组 DNA经限
制性内切酶酶切后,经电泳得到长度不同的限制
性片段,表现出片段长度的多态分布。
2.扩增片段长度多态 (AFLP),由基因组 DNA经特
异性扩增产生的 DNA片段长度的多态分布。
3.随机扩增多态性 DNA(RAPD),基因组 DNA经随
机扩增产生的 DNA片段长度的多态分布。
RT-PCR; SSCP-PCR
第五节 物种形成
一、物种的概念
1,指个体间能相互交配、并在第一世代中产生
健康而可育后代的一个自然群体。
2,通常以生殖隔离作为确定物种的标准。
生殖隔离的机制:
①合子前生殖隔离 —— 防止群体间的交流形
成杂合子;
②合子后生殖隔离 —— 降低杂合子的生存或
生殖能力。
两种都可以达到阻止群体之间基因交流的目
的。
二、物种的形成过程
1.阶段 Ⅰ,阻断同一物种两个不同群体间的基
因交流,各自独立分化,当达到生殖隔离的程度
时,便形成两个新的物种。
2.阶段 Ⅱ,阻断在两个不同栖息地的物种间的
基因之间的交流,使远源物种的差别加大。
三、物种形成的方式
1.地理物种的形成;
2.量子式物种的形成。
四、物种形成期间遗传分化的度量
最常见的两个参数:
1.遗传同一性或遗传相似性
2.遗传距离
遗传同一性( I),对两个群体中结构相同的基因
比例的估计。 I=0; I=1
遗传距离:用来估计两个群体分别进化时,每个
基因座发生的等位替换的次数。 D:0 → ∝
第六节 分子进化与中性学说
分子进化的中性学说:大多数氨基酸和核苷酸进
化的突变型的替换是由选择上呈中性或近中性的
突变经随机固定造成的。
返回
返回
代次 雌性 雄性 雌雄基因
频率差
亲代 Pxx (A) Qxx (a) Px (A) Qx (a) D= Pxx - Px
子一代 (Px + Pxx)/2 (Qx +Qxx)/2 Pxx(A) Qxx(a)
子代雌雄 A
基因频率差
D1A=(Px + Pxx)/2 – Pxx = -(Pxx -Px)/2
D1a=-(Qxx-Qx)/2
亲代交配 Pxx(A) Qxx(a)
Px(A) PxPxx(AA) PxQxx(Aa)
Qx(a) PxxQx(Aa) QxQxx(aa)
子一代雌性
基因频率
A,P1=PxPxx + (PxxQx + PxQxx)/2
=PxPxx + [Pxx(1 - Px) + Px(1- Pxx)]/2 = (Px + Pxx)/2
A,Q1=QxQxx + (PxxQx + PxQxx)/2
=QxQxx + [(1- Qxx)Qx + (1-Qx)Qxx]/2 = (Qx + Qxx)/2 返回
返回
返回