第八章
群体遗传学基础
第一节 群体遗传学概述
一、概念
群体遗传学( population genetics)
是研究群体遗传结构及其变化规律
的科学,是遗传学分支学科。它是
应用数学和统计学方法研究群体基
因频率和基因型频率及其变化的影
响因素。
二、研究目的
群体遗传学的研究目的在于阐
明生物进化的遗传机制。前面所涉
及的内容是在家系的基础上研究遗
传现象和规律,即研究特定双亲与
其后裔间的遗传关系,本章是在群
体的基础上研究遗传现象及其规律。
三、主要研究内容
1.群体的遗传组成
2.基因平衡定律
3.影响基因频率和基因型频率
变化的主要因素
四、重点和难点
? 1.重点:基因平衡的特点
? 2.难点:主要影响因素的影响过程
第二节 群体的遗传组成
一, 群体 ( population)
所谓群体是指一个种, 一个亚种,
一个变种, 一个品种或一个同质生物
的类群所有成员的总和 。 群体中的每
一个成员称为个体 。 例如秦川牛, 不
管是什么地方, 只要是秦川牛, 都属
于秦川牛这个群体, 每一个秦川牛都
是这个群体中的一个成员 。
二, 孟 德 尔 群 体 ( Mendelian
population)
在群体遗传学中, 所指的群体一
般指孟德尔群体 。 所谓孟德尔群体,
是指具有共同的基因库, 并由有性过
程 ( 雌雄交配 ) 实现繁殖的群体 。 这
里所说的基因库是指一个群体中全部
个体所共有的全部基因 。
三, 基因频率与基因型频率
在个体中遗传组成用基因型表示,
而在群体中遗传组成用基因频率和
基因型频率表示 。 所以, 基因频率
和基因型频率可表示群体的遗传组
成 。 不同群体的同一基因往往有不
同频率, 不同基因组合体系反映了
各群体性状的表现特点 。
1.基因型频率 ( genotype frequency)
基因型频率是指就特定基因位点
而言, 群体中某种基因型个体占群体
总数的比率 。
例如:某牛群的有角和无角由一对等
位基因 P和 p控制, 它们组成的基因型
有三种,PP,Pp和 pp。 用 D,H,R
分别表示三种基因型的频率 。
则 D+ H+ R= 1。
2,基因频率 ( gene frequency)
基因频率是指就特定基因位点
而言, 群体中某一基因占其全部等
位基因的比率 。
基因频率 = 某基因个数 /群体中
同一位点基因总数,
等位基因:占据同源染色体相同位
点, 以不同方式影响性状表现的两
个基因 。
复等位基因:占据同源染色体相同
位点,以不同方式影响性状表现的
三个或三个以上的基因。
值得注意的是,无论群体中复等
位基因个数有多少,每个个体最多
只能携带其中两个(如杂合子 Aa),
也可以只有其中(如纯合子 AA)。
3.基因型频率与基因频率的性质
1) 同一位点的各基因频率之和等于 1
即,p+q=1
2) 群体中同一性状的各种基因型频率
之和等于 1 即,D+ H+ R= 1
3) 基因频率的范围为大于或等于 0,小
于或等于 1,即,0≤p(q)≤1
4) 基因型频率的范围也为大于或等于 0,
小于或等于 1,即 0≤ D( H,R) ≤ 1
4.实例说明
1)人的 ABO血型决定于三个复等位基因:
IA,IB和 i。 据调查,中国人(昆明)中,
IA基因的频率为 0.24,IB基因频率为 0.21,
i基因的频率为 0.55,三者之和为
0.24+0.21+0.55=1。
2)家兔毛色决定于三个复等位基因,C
( 灰色),ch ( 八黑)和 c ( 白化) 。
5.基因频率与基因型频率的关系
1) 基因位于常染色体上
设有一对基因 A,a,其基因频率
分别为 p,q,可组成 3种基因型 AA,Aa、
aa,基因型频率分别为 D,H,R,个
体总数为 N,AA个体为 n1, Aa个体数
为 n2,aa个体数为 n3。
从以上分析得知,
D=n1/N; H =n2/N; R =n3/N;
可以算出,
P= D+ 1/2H; q= R+ 1/2H
2) 基因位于性染色体上
由于性染色体具有性别差异, 在
XY型的动物中:雌性 ( ♀ ) 为 XX,
雄性 ( ♂ ) 为 XY; 在 ZW型的动物
中, 雌性 ( ♀ ) 为 ZW,雄性 ( ♂ )
为 ZZ。 所以, 把雌雄看做两个群体
分别计算 。
( 1) 对性染色体同型群体
( XX,ZZ)
与常染色体上基因频率和基因型
频率的关系相同。
P= D+ 1/2H
q= R+ 1/2H
( 2) 性染色体异型的群体
( XY,ZW)
由于基因的数量和基因型的数
量相等, 因此基因频率等于基因型
频率也等于表型频率,
即 P=D ; q=R
只要是孟德尔群体,这种关系
在任何群体中都是适应的。
第三节 基因平衡定律
英国数学家哈代( Hardy) 和德
国医生温伯格( Weinberg),经过各
自独立的研究,于 1908年同一年发表
了有关基因频率和基因型频率的重要
规律,现统称为哈代一温伯格定律。
一, 平衡群体的条件
所谓平衡群体是指在世代更替
的过程中, 遗传组成 ( 基因频率
和基因型频率 ) 不变的群体 。 要
达到平衡群体必须具备以下条件,
1,必须是大群体
2,随机交配 ( random mating)
3.无迁移现象
4.无突变
5, 无选择, 包 括 无 人 工 选 择
(artificial selection)和自然
选择 (natural selection)。
二, 哈代 — 温伯格定律的要点
1,在一个随机交配的大群体中, 若没
有其它因素 ( 突变, 迁移, 选择 ) 的
影响, 基因频率世代不变 。
即,P0=P1=…… Pn q0=q1=…… qn
2,任何一个大群体, 无论其基因频率
如何, 只要经过一代随机交配, 一
对常染色体基因型频率就达到平衡,
若没有其它因素的影响, 一直进行随
机交配, 这种平衡状态始终不变 。
即,D 0 ? D1=D2=…… Dn
H 0 ? H1=H2=…… Hn
R0 ?R1=R2=…… Rn
3,在平衡群体中, 基因频率和基因
型频率的关系为,
D=P2
H=2pq
R=q2
三, 平衡群体的性质
性质 1:在二倍体基因平衡群体中,
杂合子( Aa) 的频率 H= 2pq的值永
远不会超过 0.5。
利用这个性质可知, 只要
H> 1/2,就绝对不是平衡群体 。
性质 2:杂合子频率是两个纯合子频
率乘积平方根的二倍 。
H= 2( DR) 0.5
四, 基因频率的计算
如前所述, 计算基因频率的基本
原理是依据表现型频率估计各基因型
频率, 然后依基因型频率计算基因频
率, 由于基因作用的方式不同, 因此
就必须按不同类型来计算 。
( 一 ) 共显性或不完全显性
在共显性或不完全显性时,计算
比较简单。因为基因型和表型一致,
即由表型直接可以识别基因型,因此,
只要知道表现型比例,就可知道基因
型频率,再通过基因型频率计算出基
因频率,所用公式为,
P= D+ 1/2H; q= R+ 1/2H
举例说明
短角牛中有白色、红色和沙毛色,
而沙毛色是红色、白色牛杂交的后代。
在牛群中白、沙、红三种毛色分别占
35%,50%和 15%,于是基因频率分
别为,
P= D+ 1/2H= 0.6
q= R+ 1/2H= 0.4
( 二 ) 完全显性时
在这种情况下, 一对基因有三种
基因型, 而只有两种表型, 显性纯合
了和杂合子表型相同, 不能识别 。 所
以, 我们只能得到隐性纯合子的基因
型频率和显性类型 ( 显性纯合子, 杂
合子 ) 频率 。 因此, 无法用上述方法
计算基因频率 。
如果是一个随机交配的大群体,
根据哈代一温伯格定律, 基因频率应
处于平衡状态, 于是, 根据隐性纯合
子的基因型频率和隐性基因频率的关
系, R=q2,可以得到 q=R0.5,从而得到
p=1- q。
举例说明
一个随机交配的牛群中, 黑色对
红色为显性, 黑牛 ( BB Bb) 占 96
%, 红牛 ( bb) 占 4%, 求基因频率 。
解:根据 R=q2,所以 q= 0.2
p=1- q=1- 0.2=0.8
( 三 ) 复等位基因
1,等显性的复等位基因
计算的基本原则为:某一基因的
频率是该基因纯合体的频率加上含有
该基因全部杂合体频率的 1/ 2。
例如, 某品种牛血红蛋白的基因有三
个等位基因 A,B,C,可组成 6种基因
型, 各基因型及频率见下表,
基因
型
AA BB CC AB AC BC 总
计
测定
头数
24 6 12 9 3 6 60
基因
型频
率
0.40 0.10 0.20 0.15 0.05 0.1 1.0
设 A,B,C三个基因频率分别为 p,q、
r; AB,AC,BC的频率为 H1,H2,
H3; AA,BB,CC的频率为 D1,D2、
D3。
A基因频率 p= D1+( H1 + H2) /2
= 0.40+( 0.15+ 0.05) /2
= 0.50
B基因频率 q
q= D2+( H1 + H3) /2
= 0.10+( 0.15+ 0.10) /2
= 0.225
C基因频率 r
r= D3+( H2+ H3) /2
= 0.20+( 0.05+ 0.10) /2
= 0.275
2,等显性及有显隐性等级的复等位
基因
人的 ABO血型是受三个复等位
基因 IA,IB,i控制的,IA和 IB为等
显性,在杂合状态下均可以得到表
现,i对 IA和 IB均为隐性。设 A,B、
O血型的比率分别为 [IA,IB,i ]=
[p,q,r],那么随机交配下一代的
基因型及频率如下。
由表现型频率推知基因频率,
首先从隐性个体频率计算 i基因的频
率,O= r2, r= O0.5
先计算出 i频率 。
∵ A+O=p2+ 2pr+ r2=( p+ r) 2
=( 1- q) 2, 1- q= ( A+O ) 0.5
q= 1- ( A+O ) 0.5
∴ p = 1- q- r
第三节 影响群体遗传变异的因素
影响频率变化的因素有:迁移,突
变,选择,遗传漂变和随机交配的
偏移。
如果正突变与反突变的个数相等,
就达到平衡,即,
vu
u
q
?
??
vu
v
p
?
??
对隐性个体的全部淘汰
0
11
qq
n
n
??
0
0
1 nq
q
q n
?
?
遗传漂移,
概念 由某一代基因库中抽样形成下
一代个体的配子时所发生的机误,
这种机误而引起基因频率的变化称
为基因的随机漂移或遗传漂变。或
者说,用随机抽样的办法建立小群
体时,由于抽样误差引起基因频率
随机波动的现象。
第四节 遗传多样性
遗传多样性在广义上是指种内或种
间表现在分子, 细胞, 个体三个水
平的遗传变异程度;狭义上则主要
指种内不同群体和个体间的遗传变
异程度 。
第五节 分子进化
进化论发展历程
1.拉马克的进化观点
2.达尔文的进化学说
3.分子钟理论
4.中性学说
群体遗传学基础
第一节 群体遗传学概述
一、概念
群体遗传学( population genetics)
是研究群体遗传结构及其变化规律
的科学,是遗传学分支学科。它是
应用数学和统计学方法研究群体基
因频率和基因型频率及其变化的影
响因素。
二、研究目的
群体遗传学的研究目的在于阐
明生物进化的遗传机制。前面所涉
及的内容是在家系的基础上研究遗
传现象和规律,即研究特定双亲与
其后裔间的遗传关系,本章是在群
体的基础上研究遗传现象及其规律。
三、主要研究内容
1.群体的遗传组成
2.基因平衡定律
3.影响基因频率和基因型频率
变化的主要因素
四、重点和难点
? 1.重点:基因平衡的特点
? 2.难点:主要影响因素的影响过程
第二节 群体的遗传组成
一, 群体 ( population)
所谓群体是指一个种, 一个亚种,
一个变种, 一个品种或一个同质生物
的类群所有成员的总和 。 群体中的每
一个成员称为个体 。 例如秦川牛, 不
管是什么地方, 只要是秦川牛, 都属
于秦川牛这个群体, 每一个秦川牛都
是这个群体中的一个成员 。
二, 孟 德 尔 群 体 ( Mendelian
population)
在群体遗传学中, 所指的群体一
般指孟德尔群体 。 所谓孟德尔群体,
是指具有共同的基因库, 并由有性过
程 ( 雌雄交配 ) 实现繁殖的群体 。 这
里所说的基因库是指一个群体中全部
个体所共有的全部基因 。
三, 基因频率与基因型频率
在个体中遗传组成用基因型表示,
而在群体中遗传组成用基因频率和
基因型频率表示 。 所以, 基因频率
和基因型频率可表示群体的遗传组
成 。 不同群体的同一基因往往有不
同频率, 不同基因组合体系反映了
各群体性状的表现特点 。
1.基因型频率 ( genotype frequency)
基因型频率是指就特定基因位点
而言, 群体中某种基因型个体占群体
总数的比率 。
例如:某牛群的有角和无角由一对等
位基因 P和 p控制, 它们组成的基因型
有三种,PP,Pp和 pp。 用 D,H,R
分别表示三种基因型的频率 。
则 D+ H+ R= 1。
2,基因频率 ( gene frequency)
基因频率是指就特定基因位点
而言, 群体中某一基因占其全部等
位基因的比率 。
基因频率 = 某基因个数 /群体中
同一位点基因总数,
等位基因:占据同源染色体相同位
点, 以不同方式影响性状表现的两
个基因 。
复等位基因:占据同源染色体相同
位点,以不同方式影响性状表现的
三个或三个以上的基因。
值得注意的是,无论群体中复等
位基因个数有多少,每个个体最多
只能携带其中两个(如杂合子 Aa),
也可以只有其中(如纯合子 AA)。
3.基因型频率与基因频率的性质
1) 同一位点的各基因频率之和等于 1
即,p+q=1
2) 群体中同一性状的各种基因型频率
之和等于 1 即,D+ H+ R= 1
3) 基因频率的范围为大于或等于 0,小
于或等于 1,即,0≤p(q)≤1
4) 基因型频率的范围也为大于或等于 0,
小于或等于 1,即 0≤ D( H,R) ≤ 1
4.实例说明
1)人的 ABO血型决定于三个复等位基因:
IA,IB和 i。 据调查,中国人(昆明)中,
IA基因的频率为 0.24,IB基因频率为 0.21,
i基因的频率为 0.55,三者之和为
0.24+0.21+0.55=1。
2)家兔毛色决定于三个复等位基因,C
( 灰色),ch ( 八黑)和 c ( 白化) 。
5.基因频率与基因型频率的关系
1) 基因位于常染色体上
设有一对基因 A,a,其基因频率
分别为 p,q,可组成 3种基因型 AA,Aa、
aa,基因型频率分别为 D,H,R,个
体总数为 N,AA个体为 n1, Aa个体数
为 n2,aa个体数为 n3。
从以上分析得知,
D=n1/N; H =n2/N; R =n3/N;
可以算出,
P= D+ 1/2H; q= R+ 1/2H
2) 基因位于性染色体上
由于性染色体具有性别差异, 在
XY型的动物中:雌性 ( ♀ ) 为 XX,
雄性 ( ♂ ) 为 XY; 在 ZW型的动物
中, 雌性 ( ♀ ) 为 ZW,雄性 ( ♂ )
为 ZZ。 所以, 把雌雄看做两个群体
分别计算 。
( 1) 对性染色体同型群体
( XX,ZZ)
与常染色体上基因频率和基因型
频率的关系相同。
P= D+ 1/2H
q= R+ 1/2H
( 2) 性染色体异型的群体
( XY,ZW)
由于基因的数量和基因型的数
量相等, 因此基因频率等于基因型
频率也等于表型频率,
即 P=D ; q=R
只要是孟德尔群体,这种关系
在任何群体中都是适应的。
第三节 基因平衡定律
英国数学家哈代( Hardy) 和德
国医生温伯格( Weinberg),经过各
自独立的研究,于 1908年同一年发表
了有关基因频率和基因型频率的重要
规律,现统称为哈代一温伯格定律。
一, 平衡群体的条件
所谓平衡群体是指在世代更替
的过程中, 遗传组成 ( 基因频率
和基因型频率 ) 不变的群体 。 要
达到平衡群体必须具备以下条件,
1,必须是大群体
2,随机交配 ( random mating)
3.无迁移现象
4.无突变
5, 无选择, 包 括 无 人 工 选 择
(artificial selection)和自然
选择 (natural selection)。
二, 哈代 — 温伯格定律的要点
1,在一个随机交配的大群体中, 若没
有其它因素 ( 突变, 迁移, 选择 ) 的
影响, 基因频率世代不变 。
即,P0=P1=…… Pn q0=q1=…… qn
2,任何一个大群体, 无论其基因频率
如何, 只要经过一代随机交配, 一
对常染色体基因型频率就达到平衡,
若没有其它因素的影响, 一直进行随
机交配, 这种平衡状态始终不变 。
即,D 0 ? D1=D2=…… Dn
H 0 ? H1=H2=…… Hn
R0 ?R1=R2=…… Rn
3,在平衡群体中, 基因频率和基因
型频率的关系为,
D=P2
H=2pq
R=q2
三, 平衡群体的性质
性质 1:在二倍体基因平衡群体中,
杂合子( Aa) 的频率 H= 2pq的值永
远不会超过 0.5。
利用这个性质可知, 只要
H> 1/2,就绝对不是平衡群体 。
性质 2:杂合子频率是两个纯合子频
率乘积平方根的二倍 。
H= 2( DR) 0.5
四, 基因频率的计算
如前所述, 计算基因频率的基本
原理是依据表现型频率估计各基因型
频率, 然后依基因型频率计算基因频
率, 由于基因作用的方式不同, 因此
就必须按不同类型来计算 。
( 一 ) 共显性或不完全显性
在共显性或不完全显性时,计算
比较简单。因为基因型和表型一致,
即由表型直接可以识别基因型,因此,
只要知道表现型比例,就可知道基因
型频率,再通过基因型频率计算出基
因频率,所用公式为,
P= D+ 1/2H; q= R+ 1/2H
举例说明
短角牛中有白色、红色和沙毛色,
而沙毛色是红色、白色牛杂交的后代。
在牛群中白、沙、红三种毛色分别占
35%,50%和 15%,于是基因频率分
别为,
P= D+ 1/2H= 0.6
q= R+ 1/2H= 0.4
( 二 ) 完全显性时
在这种情况下, 一对基因有三种
基因型, 而只有两种表型, 显性纯合
了和杂合子表型相同, 不能识别 。 所
以, 我们只能得到隐性纯合子的基因
型频率和显性类型 ( 显性纯合子, 杂
合子 ) 频率 。 因此, 无法用上述方法
计算基因频率 。
如果是一个随机交配的大群体,
根据哈代一温伯格定律, 基因频率应
处于平衡状态, 于是, 根据隐性纯合
子的基因型频率和隐性基因频率的关
系, R=q2,可以得到 q=R0.5,从而得到
p=1- q。
举例说明
一个随机交配的牛群中, 黑色对
红色为显性, 黑牛 ( BB Bb) 占 96
%, 红牛 ( bb) 占 4%, 求基因频率 。
解:根据 R=q2,所以 q= 0.2
p=1- q=1- 0.2=0.8
( 三 ) 复等位基因
1,等显性的复等位基因
计算的基本原则为:某一基因的
频率是该基因纯合体的频率加上含有
该基因全部杂合体频率的 1/ 2。
例如, 某品种牛血红蛋白的基因有三
个等位基因 A,B,C,可组成 6种基因
型, 各基因型及频率见下表,
基因
型
AA BB CC AB AC BC 总
计
测定
头数
24 6 12 9 3 6 60
基因
型频
率
0.40 0.10 0.20 0.15 0.05 0.1 1.0
设 A,B,C三个基因频率分别为 p,q、
r; AB,AC,BC的频率为 H1,H2,
H3; AA,BB,CC的频率为 D1,D2、
D3。
A基因频率 p= D1+( H1 + H2) /2
= 0.40+( 0.15+ 0.05) /2
= 0.50
B基因频率 q
q= D2+( H1 + H3) /2
= 0.10+( 0.15+ 0.10) /2
= 0.225
C基因频率 r
r= D3+( H2+ H3) /2
= 0.20+( 0.05+ 0.10) /2
= 0.275
2,等显性及有显隐性等级的复等位
基因
人的 ABO血型是受三个复等位
基因 IA,IB,i控制的,IA和 IB为等
显性,在杂合状态下均可以得到表
现,i对 IA和 IB均为隐性。设 A,B、
O血型的比率分别为 [IA,IB,i ]=
[p,q,r],那么随机交配下一代的
基因型及频率如下。
由表现型频率推知基因频率,
首先从隐性个体频率计算 i基因的频
率,O= r2, r= O0.5
先计算出 i频率 。
∵ A+O=p2+ 2pr+ r2=( p+ r) 2
=( 1- q) 2, 1- q= ( A+O ) 0.5
q= 1- ( A+O ) 0.5
∴ p = 1- q- r
第三节 影响群体遗传变异的因素
影响频率变化的因素有:迁移,突
变,选择,遗传漂变和随机交配的
偏移。
如果正突变与反突变的个数相等,
就达到平衡,即,
vu
u
q
?
??
vu
v
p
?
??
对隐性个体的全部淘汰
0
11
n
n
??
0
0
1 nq
q
q n
?
?
遗传漂移,
概念 由某一代基因库中抽样形成下
一代个体的配子时所发生的机误,
这种机误而引起基因频率的变化称
为基因的随机漂移或遗传漂变。或
者说,用随机抽样的办法建立小群
体时,由于抽样误差引起基因频率
随机波动的现象。
第四节 遗传多样性
遗传多样性在广义上是指种内或种
间表现在分子, 细胞, 个体三个水
平的遗传变异程度;狭义上则主要
指种内不同群体和个体间的遗传变
异程度 。
第五节 分子进化
进化论发展历程
1.拉马克的进化观点
2.达尔文的进化学说
3.分子钟理论
4.中性学说