第 4 节 核酸与基因
Concept of Nucleic acid
and the Gene
一 基因的概念
早期的基因概念
经典的基因概念
基因概念的演变与发展
基因的分子结构
基因概念的多样性
融合遗传理论 ( Blending inheritane)
母本体液 父本体液
子代具有父,母双亲的性状
+
? 获得的性状是由环境影响 (非遗传物质的改变 )
? 新性状一旦获得,便能遗传给后代
L.B.Lamarck
获得性遗传理论 (Inheritance of acquired characters)
? 物种 加强和完善对环境的适应 逐渐转变为新种
泛生论假说 ( Hypothesis of the Pangenesis)
C,Darwin 1868
种质论 ( Theory of germplasm)
Germeplasm
Somatoplasm
Root,Stem,Leaf……
A.Weismann 1883.
Somatoplasm
→ Germplasm → Germplasm
孟德尔 (1823-1884),遗传学之父”
阐述了遗传学的 分离 和 自由组合 两大定
律,以及, 基因, 的概念。
Mendel's Paper in English
Experiments in Plant Hybridization (1865)
by Gregor Mendel
Read at the meetings of February 8th,and March 8th,1865
[1] Introductory Remarks
Experience of artificial fertilization,such as is effected with ornamental
plants in order to obtain new variations in color,has led to the experiments
which will here be discussed,The striking regularity with which the same
hybrid forms always reappeared whenever fertilization took place between
the same species induced further experiments to be undertaken,the object
of which was to follow up the developments of the hybrids in their progeny.
遗传因子假说 (Hypothesis of the inherited factor)
G,J,Mendel 1866,? 生物性状由遗传因子控制
? 亲代传给子代的是遗传因子 (A,a…,)
? 遗传因子在体细胞内成双 (AA,aa),
在生殖细胞内为单 ( A,a)
? 杂合子后代体细胞内具有成双的
遗传因子 (Aa)
? 等位的遗传因子独立分离,非等
位遗传因子间自由组合地分配到
配子中
摩尔根:
阐述了遗传学的连锁与交换定律,
被誉为“现代实验生物学奠基人”。
Theory of the gene
? 基因是染色体上的实体
? 基因象链珠 (bead)一样,孤立地呈
线状地排列在染色体上
? 基因是;
功能 (functional unit)
突变 (mutation unit)
交换 (cross-over unit)
“三位一体”的
(Three in one)
最小的
不可分割的
基本的
遗传单位
(1926 T,H,Morgan)
★ Transcriptable,translatable gene ( Z,Y,A )
Transcriptable but nontranslatable gene
( tDNA,rDNA )
Nontranscriptable,nontranslatable gene ( promoter,
operator )
Forms of genes
★ cis action factor
Affects the activity only of DNA sequences on its
own molecular of DNA,this property usually implies
that the factor does not code for protein
通过核苷酸自身的特异二级结构控制与它紧密连锁的结
构基因的表达, 一般不编码蛋白质 。 (无基因产物的 DNA功能
区 )
Forms of genes
★ trans action factor
★ cis-dominant(显性 )
Affects the activity of any gene located on genome(基因组 )
by its translated product.
通过扩散自身表达产物 ( 酶, 调节蛋白 ) 控制其他基因的表达
可转录, 可翻译调节蛋白的 DNA功能区,可通过互补测验体系确
定其功能区域
The ability of a site (cis-factor) to control adjacent gene
irrespective of the presence in the cell of other alleles(等位
基因 ) of the site.
cis acting factor 对与其紧密连锁基因的控制效应不受其等位基
因的影响。
? DNA is genetic material
? Is the protein genetic material?
复制? 表面遗传信息?
? RNA is genetic material also
Tobacco Mosaic Virus (TMV)
▲ Hershey lambdar phage cycle
▲ Watson & Crick DNA double helix
RII DNA SIII
▲ 1928 Griffith 1944 Avery O.T
DNA 是主要的遗传物质
● DNA作为遗传物质的优点 (自然选择的优势 )
★ 储存遗传信息量大
1kb DNA序列 41000 种遗传信息
★ 核糖的 2’ – OH 脱氧 在水溶液中的稳定性高于 RNA
★ 可以突变
方便修复
以求不断进化
以求稳定遗传
★ A / T,C / G 互补 双螺旋结构 复制,转录
遗传稳定
生物进化的 C值矛盾 (C value paradox of nucleotide)
The total amount of DNA in the genome of haploid
is a characteristic of each living species known as its
Maximum C value (单倍体基因组总 DNA 的含量叫作 C值 )
最大 C值 Maximum C value
The total amount of DNA for encoding the genes
information is termed its Minimum c value ( 编码基因信息
的总 DNA含量叫作 c値)
最小 C值 Minimum c value
C value paradox of nucleotide
霉菌
藻类
G+细菌
G-细菌
显花植物
鸟类
哺乳类
爬行类
两栖类
硬骨鱼类
软骨鱼类
赖皮类
甲壳类
昆虫类
软体动物
蠕虫类
真菌
枝原体
A 生物体进化程度高低
与大 C值不成 明显正相关
B 亲缘关系相近 的生
物大 C值相差较大
C 一种生物内大 C值与
小 c值相差极大
( Euk,人体 c = C/10)
( Prok,Φx174 c > C )
真核生物 DNA 染色体数
( 2C) ( 2N)
两栖鲵 168 pg 24
肺鱼 100 38
蝾螈 85.3 24
警蛙 28.2 24
牛 6.4 60
人 6.4 46
绵羊 5.7 54
果蝇 0.2 8
贝母 196.7 24
豌豆 28 12
玉米 11 20
原核生物 DNA
( C)
Salmonella 0.0143 pg
E.coli 0.0040
T2 0.00022
λ 0.0000055
ΦΧ174 0.000005
重复序列分类
a) 高度重复序列 ( High repetitive sequence)
Microsatellite
DNA
2-10 bp / copy
105-106 copies / genome
C0t(1/2)< 0.001 多为串联重复排列
分布于着丝点,端粒区,结构基因两侧
5-50 copies / genome Minisatellite DNA
( Variable number tandem repeats, VNTR )
重复基因 (Repetitive gene)
104 bp fragment CsCl gradient centrifugation
Sequence in satellite DNA
Sea crab 2 ATATAT…..
Drosophila 5 ATAATATAAT…..
Mouse 9 GAAAAATGAGAAAAATGA
bp of repeat unit sequence
ProkaryoteEukaryote
(GC%) 42
4134
55
MOUSE CALF
b) 中度重复序列
( middle repetitive sequence )
100-1000 bp / copy
10-104 copies / genome
C0t(1/2) ~ 0.001 - 0.1
rDNA tDNA
Histone gene cluster
Middle repeat gene
特点
拷贝重复,多量
序列多为相似
排列成束成串
功能完全相同
具有进化的整体性,累积突变
c) 单拷贝序列
(single copy sequence,1-3 copies)
低等真核生物 10-20%
高等植物 80% repetitive sequence
高等动物 50%
多为结构基因
如 tRNA,各种酶基因等
d) 反向重复序列
(inverted repetitive sequence))
CAT GAACGTCC TATTGTC GGACGTTC TGA
GTA CTTGCAGG ATAACAG CCTGCAAG ACT
在 DNA和 RNA中可形成发夹结构或十字结构。
在 DNA中要形成这种结构需要能量,因此,发生
可能性很小。
上述结构也回纹结构 (Palidrome),较短的回纹结构
可作为一种特别信号,可被限制性内切酶所识别。
e) 间隔序列
人们对间隔序列的认识是限的。一些人认为
这些序列是多余的,因此认为是,junk”。
基因组的非编码序列, 包括编码区 (外显子 )
之间的间隔序列 —内含子, 以及基因与基因之间
的序列 。
但近年来也有研究表明对转录等有作用,并不
是, junk”。,
内含子可在 DNA水平上移位 —一个可移动
的基因元件,具有转座作用;
生物体内的内含子本身有可译框架,能编码
蛋白质和酶;
RNA水平上的内含子 —可变剪接是基因表达的
一种特殊调节方式;
内含子能编码小核仁 RNA,积累在核仁中,与
核糖体生成、装配有关。
重叠基因 (overlapping gene)
方式
? Mis-reading for stop codon
( Q? RNA virus 1973,A,Weiner )
400Nt 800Nt
AUG----------------------UGA-----------------------UAA
UGA,UAG 易被漏读, 错读
UAA 能严格终止
14Kd Cp 97%
38Kd Ip 3%
种类
※ I 类; 反向重叠基因
(重叠基因分布在同一 DNA区域的不同单链上)
IA
IC ID
IB
方式? !
※ II 类; 同向重叠基因
(重叠基因分布在同一 DNA区域的同一单链上)
方式?
IIA
IIB
IIC
IID
X174 ( F,Sanger,1977 )? Alternate different reading frame
5387 bp
11 genes
3 mRNA
9 peptides
C = 5387 bp
---ATG-----//------AATGCC ----//---ATAACG---//--TAA----A
B ATGCCN----NNATAA
---AUG--------TCAUGCCCAA----AUGAGGC--------------
Vp2 Start
? Selection different start codon or stop codon
(Simian Virus 40 SV40)
SV40
Vp1 Start
Vp3 Start
Vp1
Vp2
Vp3
--------------TCAUGCCCAAACUAGGC--------------
Start
Stop
stop
start
Alternate different reading frame
rDNA gene family
Sea urchia 450copies
Tobacco 750 copies
Drosophila 100 copies
Histone gene family
H1 H4 H2B H3 H2A
T 18s T 5.8s T 28s NT 18s T 5.8s T
45s
41s
20s 32s
28s5.8s18s
重叠基因的生物学意义
a) 原核生物进化的 经济 原则
(较小的 C值编码较多的基因信息 )
b) 提高蛋白质 疏水性,以增强生物体自然选择的适应性
密码子进化理论认为 ;
NYR多为 Hydrophobic amino acid,改变蛋白质性能
原始密码子多为 RNYRNYRNY ( A/G N U/C)
RNYRNYRNY ( N Y R)
(N A/G U/C)+1移码,进化
Concept of Nucleic acid
and the Gene
一 基因的概念
早期的基因概念
经典的基因概念
基因概念的演变与发展
基因的分子结构
基因概念的多样性
融合遗传理论 ( Blending inheritane)
母本体液 父本体液
子代具有父,母双亲的性状
+
? 获得的性状是由环境影响 (非遗传物质的改变 )
? 新性状一旦获得,便能遗传给后代
L.B.Lamarck
获得性遗传理论 (Inheritance of acquired characters)
? 物种 加强和完善对环境的适应 逐渐转变为新种
泛生论假说 ( Hypothesis of the Pangenesis)
C,Darwin 1868
种质论 ( Theory of germplasm)
Germeplasm
Somatoplasm
Root,Stem,Leaf……
A.Weismann 1883.
Somatoplasm
→ Germplasm → Germplasm
孟德尔 (1823-1884),遗传学之父”
阐述了遗传学的 分离 和 自由组合 两大定
律,以及, 基因, 的概念。
Mendel's Paper in English
Experiments in Plant Hybridization (1865)
by Gregor Mendel
Read at the meetings of February 8th,and March 8th,1865
[1] Introductory Remarks
Experience of artificial fertilization,such as is effected with ornamental
plants in order to obtain new variations in color,has led to the experiments
which will here be discussed,The striking regularity with which the same
hybrid forms always reappeared whenever fertilization took place between
the same species induced further experiments to be undertaken,the object
of which was to follow up the developments of the hybrids in their progeny.
遗传因子假说 (Hypothesis of the inherited factor)
G,J,Mendel 1866,? 生物性状由遗传因子控制
? 亲代传给子代的是遗传因子 (A,a…,)
? 遗传因子在体细胞内成双 (AA,aa),
在生殖细胞内为单 ( A,a)
? 杂合子后代体细胞内具有成双的
遗传因子 (Aa)
? 等位的遗传因子独立分离,非等
位遗传因子间自由组合地分配到
配子中
摩尔根:
阐述了遗传学的连锁与交换定律,
被誉为“现代实验生物学奠基人”。
Theory of the gene
? 基因是染色体上的实体
? 基因象链珠 (bead)一样,孤立地呈
线状地排列在染色体上
? 基因是;
功能 (functional unit)
突变 (mutation unit)
交换 (cross-over unit)
“三位一体”的
(Three in one)
最小的
不可分割的
基本的
遗传单位
(1926 T,H,Morgan)
★ Transcriptable,translatable gene ( Z,Y,A )
Transcriptable but nontranslatable gene
( tDNA,rDNA )
Nontranscriptable,nontranslatable gene ( promoter,
operator )
Forms of genes
★ cis action factor
Affects the activity only of DNA sequences on its
own molecular of DNA,this property usually implies
that the factor does not code for protein
通过核苷酸自身的特异二级结构控制与它紧密连锁的结
构基因的表达, 一般不编码蛋白质 。 (无基因产物的 DNA功能
区 )
Forms of genes
★ trans action factor
★ cis-dominant(显性 )
Affects the activity of any gene located on genome(基因组 )
by its translated product.
通过扩散自身表达产物 ( 酶, 调节蛋白 ) 控制其他基因的表达
可转录, 可翻译调节蛋白的 DNA功能区,可通过互补测验体系确
定其功能区域
The ability of a site (cis-factor) to control adjacent gene
irrespective of the presence in the cell of other alleles(等位
基因 ) of the site.
cis acting factor 对与其紧密连锁基因的控制效应不受其等位基
因的影响。
? DNA is genetic material
? Is the protein genetic material?
复制? 表面遗传信息?
? RNA is genetic material also
Tobacco Mosaic Virus (TMV)
▲ Hershey lambdar phage cycle
▲ Watson & Crick DNA double helix
RII DNA SIII
▲ 1928 Griffith 1944 Avery O.T
DNA 是主要的遗传物质
● DNA作为遗传物质的优点 (自然选择的优势 )
★ 储存遗传信息量大
1kb DNA序列 41000 种遗传信息
★ 核糖的 2’ – OH 脱氧 在水溶液中的稳定性高于 RNA
★ 可以突变
方便修复
以求不断进化
以求稳定遗传
★ A / T,C / G 互补 双螺旋结构 复制,转录
遗传稳定
生物进化的 C值矛盾 (C value paradox of nucleotide)
The total amount of DNA in the genome of haploid
is a characteristic of each living species known as its
Maximum C value (单倍体基因组总 DNA 的含量叫作 C值 )
最大 C值 Maximum C value
The total amount of DNA for encoding the genes
information is termed its Minimum c value ( 编码基因信息
的总 DNA含量叫作 c値)
最小 C值 Minimum c value
C value paradox of nucleotide
霉菌
藻类
G+细菌
G-细菌
显花植物
鸟类
哺乳类
爬行类
两栖类
硬骨鱼类
软骨鱼类
赖皮类
甲壳类
昆虫类
软体动物
蠕虫类
真菌
枝原体
A 生物体进化程度高低
与大 C值不成 明显正相关
B 亲缘关系相近 的生
物大 C值相差较大
C 一种生物内大 C值与
小 c值相差极大
( Euk,人体 c = C/10)
( Prok,Φx174 c > C )
真核生物 DNA 染色体数
( 2C) ( 2N)
两栖鲵 168 pg 24
肺鱼 100 38
蝾螈 85.3 24
警蛙 28.2 24
牛 6.4 60
人 6.4 46
绵羊 5.7 54
果蝇 0.2 8
贝母 196.7 24
豌豆 28 12
玉米 11 20
原核生物 DNA
( C)
Salmonella 0.0143 pg
E.coli 0.0040
T2 0.00022
λ 0.0000055
ΦΧ174 0.000005
重复序列分类
a) 高度重复序列 ( High repetitive sequence)
Microsatellite
DNA
2-10 bp / copy
105-106 copies / genome
C0t(1/2)< 0.001 多为串联重复排列
分布于着丝点,端粒区,结构基因两侧
5-50 copies / genome Minisatellite DNA
( Variable number tandem repeats, VNTR )
重复基因 (Repetitive gene)
104 bp fragment CsCl gradient centrifugation
Sequence in satellite DNA
Sea crab 2 ATATAT…..
Drosophila 5 ATAATATAAT…..
Mouse 9 GAAAAATGAGAAAAATGA
bp of repeat unit sequence
ProkaryoteEukaryote
(GC%) 42
4134
55
MOUSE CALF
b) 中度重复序列
( middle repetitive sequence )
100-1000 bp / copy
10-104 copies / genome
C0t(1/2) ~ 0.001 - 0.1
rDNA tDNA
Histone gene cluster
Middle repeat gene
特点
拷贝重复,多量
序列多为相似
排列成束成串
功能完全相同
具有进化的整体性,累积突变
c) 单拷贝序列
(single copy sequence,1-3 copies)
低等真核生物 10-20%
高等植物 80% repetitive sequence
高等动物 50%
多为结构基因
如 tRNA,各种酶基因等
d) 反向重复序列
(inverted repetitive sequence))
CAT GAACGTCC TATTGTC GGACGTTC TGA
GTA CTTGCAGG ATAACAG CCTGCAAG ACT
在 DNA和 RNA中可形成发夹结构或十字结构。
在 DNA中要形成这种结构需要能量,因此,发生
可能性很小。
上述结构也回纹结构 (Palidrome),较短的回纹结构
可作为一种特别信号,可被限制性内切酶所识别。
e) 间隔序列
人们对间隔序列的认识是限的。一些人认为
这些序列是多余的,因此认为是,junk”。
基因组的非编码序列, 包括编码区 (外显子 )
之间的间隔序列 —内含子, 以及基因与基因之间
的序列 。
但近年来也有研究表明对转录等有作用,并不
是, junk”。,
内含子可在 DNA水平上移位 —一个可移动
的基因元件,具有转座作用;
生物体内的内含子本身有可译框架,能编码
蛋白质和酶;
RNA水平上的内含子 —可变剪接是基因表达的
一种特殊调节方式;
内含子能编码小核仁 RNA,积累在核仁中,与
核糖体生成、装配有关。
重叠基因 (overlapping gene)
方式
? Mis-reading for stop codon
( Q? RNA virus 1973,A,Weiner )
400Nt 800Nt
AUG----------------------UGA-----------------------UAA
UGA,UAG 易被漏读, 错读
UAA 能严格终止
14Kd Cp 97%
38Kd Ip 3%
种类
※ I 类; 反向重叠基因
(重叠基因分布在同一 DNA区域的不同单链上)
IA
IC ID
IB
方式? !
※ II 类; 同向重叠基因
(重叠基因分布在同一 DNA区域的同一单链上)
方式?
IIA
IIB
IIC
IID
X174 ( F,Sanger,1977 )? Alternate different reading frame
5387 bp
11 genes
3 mRNA
9 peptides
C = 5387 bp
---ATG-----//------AATGCC ----//---ATAACG---//--TAA----A
B ATGCCN----NNATAA
---AUG--------TCAUGCCCAA----AUGAGGC--------------
Vp2 Start
? Selection different start codon or stop codon
(Simian Virus 40 SV40)
SV40
Vp1 Start
Vp3 Start
Vp1
Vp2
Vp3
--------------TCAUGCCCAAACUAGGC--------------
Start
Stop
stop
start
Alternate different reading frame
rDNA gene family
Sea urchia 450copies
Tobacco 750 copies
Drosophila 100 copies
Histone gene family
H1 H4 H2B H3 H2A
T 18s T 5.8s T 28s NT 18s T 5.8s T
45s
41s
20s 32s
28s5.8s18s
重叠基因的生物学意义
a) 原核生物进化的 经济 原则
(较小的 C值编码较多的基因信息 )
b) 提高蛋白质 疏水性,以增强生物体自然选择的适应性
密码子进化理论认为 ;
NYR多为 Hydrophobic amino acid,改变蛋白质性能
原始密码子多为 RNYRNYRNY ( A/G N U/C)
RNYRNYRNY ( N Y R)
(N A/G U/C)+1移码,进化