Introduction of Molecular Biology
中心法则
RNA
PROTEINDNA
Genomics
Functional genomics
Proteomics
An introduction of gene function
1,Storing Information
2,Replication
3,Mutation
Overview of gene expression
肽键的形成
an example of protein secondary structure,а -helix
An antiparallel β -sheet
tertiary structure of myoglobin(肌红蛋白 )
The globular domains of immunoglobulin
( quaternary structure )
summary
Proteins are polymers of amino acids linked
through peptide bonds,
The sequence of amino acids in a polypeptide
(primary structure) gives rise to that molecule,s
local shape (secondary structure),overall shape
(tertiary structure),and interaction with other
polypeptides (quaternary structure)..
Transcription
Translation
5,---ATGCTGCATGC ATGGGATATAGGCCT TAG CACACGTCC— 3,
ORF
Transcription
initiation site Transcription termination site
Opening reading frame
Transcription
GCUGCAUGC ATUGGAUAUAGGCCU UAG CACACGUCC--3
5,-UTR
Untranslated region
(leader)
Coding region 3,-UTR
Untranslated region
(tailer)
fMet-Gly-Tyr-Arg-Pro
Translation
第二章 DNA的结构与复制
2.1,Basic Concept
DNA复制,亲代双链 DNA分子在 DNA聚合酶的作用下,分别以每单链 DNA分子为模板,
聚合与自身碱基可以互补配对的游离的
dNTP,合成出两条与亲代 DNA分子完全相同的子代 DNA分子的过程。
● Replicon复制子 p18
● Replisome
A unit of the genome in which DNA
contain a region from origin to terminator
复制体:一种多蛋白复合体,包含 DNA聚合酶,
引发酶,解旋酶,单链结合蛋白和其它辅助因子。
复制体位于每个复制叉处进行细菌染色体
DNA复制的聚合反应。
DNA replication at phase S of cell cycle
E.coli 37 ℃
105 bp/min S
6-8hs
M
1hG2
3-4hs
mammalian cell
22-25hrs
500-5000 bp/min
G1
12hs
20min
为什么真核生物复制这么缓慢
复制机理的复杂性
D.S,DNA S.S,DNA 能量的供求构型的变化 超螺旋 线状,开环状多种酶类的互作 Replisome
DNA复制起始控制机理知之甚少复制的准确性 (修复,校正)
研究试材的特殊性 (温度敏感型 ts,突变抑制体系 Su)
DNA复制速度 (E.coli 105 bp/min,高速解旋 112 km/h?)
缺乏统一的模式 (D.S,DNA,S.S,DNA,Linear DNA….)
2.2,replication origin & direction
the character of replication origin
oriC
,呼吸现象,
DNA复制原点处氢键迅速断裂与再生,导致两条
DNA链不断解链与聚合,形成瞬间的单泡状结构的过程。 在富含 AT的区域内尤为明显
replication origin 两侧基因的转导频率高
复制模式多样
245bp minimal origin of replication
rich AT & DNA polymerase (DnaA) binding site
单 起点,单 方向多 起点,单 方向单 起点,双 方向多 起点,双 方向
OriC
OriC
Rich AT
Rich AT
Directionof DNA replication
Bidirectional replication
Monodirectional replication
双向等速复制
子链 DNA延伸方向
DNA polymerase reacts on the 3’ end only
OH
T C A
T C A C
OH 3’
New DNA elongation from 5’ to 3’ direction
ppp OH
C
+
+ ppi
5’PPP
5’PPP
如果 DNA的延伸方向是 3’ → 5’
A T C G
+ 5’ ppp OH 3’
G
ppp OH
G A T C G
5’ ppp OH 3’
A T C G
+ 5’ ppp OH 3’
G
ppp OH
G
5’ ppp
因能量的需要,DNA的 5’
端必须带有 PPP游离 dNTP具有 PPP
ppp OH 3’
A T C G
在 0.2M Nacl 的生理环境中,磷酸基团间的强电负性,
使 dNTP难以聚合到 DNA的 5‘端,而且 双链 DNA的 5’
端碱基配对困难 需要其他机制以解脱
3‘
5‘
OK !
How?
5‘
3‘
5‘
3‘
a) Okazaki fragment 1968 Reiji Okazaki
E.coli [t-]
2’’,7’’,15’’,60’’
pulse-labeling in dT-H3
stop in KCN 0℃
D.S,DNA
S.S,DNA
Density gradient of sucrose
Measure H3-T
pulse-chase
20℃ in dT-H3 30’’
transfer to dT then continue
At least one strand of DNA replication in Okazaki fragment 1kb
5‘
3‘
5‘
3‘
DNA replication in
Okazaki fragment 1kb
5‘
3‘
5‘
3‘
( semi-discontinuous replication ! )

2.3,DNA replication model
● de novo initiation(新起始方式) or
replication fork (复制叉式)
starting point
( Cairns model,θform,theda form)
RNA primer transcription activation
→ leading strand → fork → lagging strand
multiple replicon
Eukaryote(500-5000bp/min)
primer
M13 感染宿主后不裂解宿主细胞,而是从感染的细胞中分泌出噬菌体颗粒,宿主细胞仍能继续生长和分裂
E.coli
[Rif s ]
[Rif S ] + M13
E.coli
E.coli
[ Rif R ]
M13+
S.S,DNA virus
+
RF
无 M13 RF
Rifampin M13
Rifampin
有 M13 RF
有 M13 RF
M13
Rifampin
( DNA聚合酶不能发动子链 DNA的复制起始 )
Rifampin 是 E.coli RNA polymerase 的抑制剂
M13 RF的形成需要 RNA polymerase发动合成一段 RNA分子作为引物
RF启动后,RNA引物已经形成,Rifampin 的抑制无效
Conclusion
The first evidence supporting RNA priming
DNA transcriptional activation
RNA polymerase [ Rif S ]
10 Nt RNA primer for leading Strand
origin
dnaG primase [ Rif R ] for lagging Strand
primosome
Synthesis of progeny strand in lagging DNA
ppp
RNA as primer
DNA polymerase III
ppp
DNA polymerase I
DNA
ligase
RNApol (RNA polymerase) [ Rif S ]
dnaG (primase) [Rif R ]
完成对后随链引物的合成
完成 10 ± NtRNA引物合成后,DNApolII进行 DNA链的延伸
DNApol I 对 RNA引物切除并聚合填补
连接酶 (ligase)将 Okazaki 片段,dUMP 片段连接完成对先导链引物的合成实现 DNA复制的转录激活起始较先导链的启动落后一个 Okazaki片断
Conclusion
复制叉两侧 DNA双螺旋的解旋
E.coli
C / genome = 4.2 X 106 bp
30-40’ / 每次复制历时
10 bp / 每圈螺旋
84000 bp 解旋 / 分
( 8400 rpm ! 高速离心机 )
能量?
DNA topoisomerase I DNA的单链瞬间断裂
( transient single-strand break)
缓解 高速旋转
DNA topoisomerase II DNA的双链瞬间断裂
( transient double-strand break)
缓解 高速解旋时,DNA双链的相互缠绕产生 负超 消除复制叉移动时产生的 正超
DNA Helicase (DNA 解旋酶)
ATPase活性,解除 1氢键 /水解 2ATP
Top I,Top II
Helicase (rep protein)
Single Strand Binding protein (SSB)
Helix destabilizing protein (HDP)
DnaB pritein
DnaC protein
Primase( dnaG)
Ung-ase
DNA Polymerase III
DNA Polymerase I
Ligase
for primosome
复制体进 化 中 形 成 了 灵 活 的 多 酶 复 合 体
replisome
进 化 中 形 成 了灵 活 的 多 酶 复 合 体 replisome
位于复制叉处的多酶复合体完成
lagging Strand DNA延伸时,
必须快速从一个冈崎片段移到另一冈崎片段
In lagging Strand 多酶系统必须必须完成多次反复的启动与扩展
E.coli 启动 2000—4000次的冈崎片段复制
Replisome model (后随链的回环模式 )
3’-OH?
3‘-OH
Lagging strand of circle DNA replication
Lagging strand of linear DNA replication
But
3‘
5‘
5‘
3‘
3’-OH?
2.5,线状 DNA的复制及避免 5’末端短缩的模式 ( 5’-end shorten )
c) 真核生物染色体 DNA末端补齐模式
● 端粒的发现
1938 Muller
X-ray Drosophila
末端极少发生缺失和倒位推测染色体两端存在特殊结构,
使染色体趋于稳定,
并定名为 Telomere
1938 B.McClintock
顶端缺失染色体易于融合,而正常染色体不易连接。
推测染色体末端具有特殊端粒结构。
1970s 分子生物学发展 端粒研究获得突破端粒酶的发现为揭示端粒序列复制的模板及避免 5’端短缩的机制奠定了重要的基础端粒的模板链在何处?
端粒 DNA (Telomere)
TTGGGG(T2G4)序列高度重复的末端
5’ TTGGGGTTGGGGTTGGGGTTGGGG 3’ (rich G chain)
3’ AACCCC AACCCC AACCCC 5’ (rich C chain)
端粒酶,具有 逆转录酶活性的 末端结合蛋白 (TBP)
端粒酶中 CAACCCCAA序列是端粒重复序列
( GGGGTT) n合成的模板
1990 Yu和 Blackburn 在体外加尾实验的反应体系中加入这段 RNA区域的反义序列 GTTGGGGTTG
证明端粒酶中 CAACCCCAA序列是端粒重复序列( GGGGTT) n合成的模板端粒酶的加尾功能受到明显抑制
1990 Yu和 Blackburn 在体外加尾实验的反应体系中证明端粒酶中 CAACCCCAA序列是端粒重复序列( GGGGTT) n合成的模板转化四膜虫后代的染色体端粒出现了 突变序列 的端粒对 CAACCCCAA序列进行诱变
model
TBP is Reverse transcriptase-like
RNA complement with 3’ end of DNA
& as template for cDNA
Elongated T2G4 3’-end as primer for 5’-end DNA synthesis
G链 –T2G4-----TTGGGGT TGGG
C链 --A2C4----
telomerase3’
aaaAACCCCAACuuac--- 5’
TTG
G链 –T2G4-----TTGGGGT TGGG
C链 --A2C4----
TTG
telomerase3’
aaaAACCCCAACuuac--- 5’
GGGTTG
G链 –T2G4-----TTGGGGT TGGG
C链 --A2C4----
TTGGGGTTG -------------
telomerase3’
CCAACCCCAACCCC--- 5’
telomerase3’
CCAACCCCAACCCC--- 5’
When G-rich strand is longer enough
telomeras3’
aaaAACCCCAACuuac--- 5’
G G hoogsteen bond
Tetraplex helix
G链 –T2G4-----TTGGGG TTGGGGTTGGGGTTGGGGTTGGGG
C链 --A2C4-----
G链 –T2G4-----TTGGGG t t g g g g t t g
C链 --A2C4----- AACCCCAA g g g g t t
g
gg
Primase AACCCCAACCCCAACCCCAACCCC ADNA pol
or
5‘
3‘
T
T T
G
G
G
G
G
G
G
G G
G
G
G
GG
G
G
G
G
T
T T
T
TT
GGGGTTTGGGGTTTGGGGTTT
真核生物染色体端粒 DNA结构
Telomerase activity is repressed in somatic cells of
multicelluar organisms resulting in a gradual
shortening of the chromosome with each cell
generation,As this shortening reaches informational
DNA,the cells senesce and die,
细胞分裂端粒阈值
informational DNA
细胞停止分裂或死亡
When telomerase
activity is repressed
人体发育完成,端粒酶被抑制,
细胞分裂次数与端粒长短呈正比细胞分裂端粒阈值端粒长短端粒酶活
Harley (1989)
端粒的重复片段为探针检测胎儿细胞株婴儿细胞株青年细胞株老年细胞株年龄小大端粒长度长短早衰性侏儒症的端粒明显较正常人短
―多莉”的衰老

研究端粒 (记时器) 丢失的速率 / 年,预测人类的寿命
XX XY why?
PCD机制、癌细胞的无限繁殖 (癌细胞中的端粒酶被激活 )
随着组织、细胞的老化染色体端粒的长度变短小麦不同细胞内端粒长度的变化
The termination of DNA replication
E.coli (单起点双方向 )
两复制叉的相遇处具有多个终止位点 (不是复制叉简单相遇)
terE,D,A terF,C,B (22bp保守区 )
F B
Terminus Utilization Substance( TUS 36kd)
C A
D
E Ter-TUS复合体
terE,D,A 仅对反时针方向的复制叉具有终止效应
terF,B,C 仅 对 顺时针 方向的复制叉具有终止效应
F B C A
D
E
Ter-TUS复合体 (Rep,fork trap)
终止 DnaB(螺旋酶 )
防止 DNA过度复制避免出现 DNA多聚体,高拷贝氨基酸饥饿状态,DNA复制起始失控
4.6 DNA的复制基因与酶类体系
a)原核生物的复制基因与酶类
Initiate genes
dna B prepriming 300kd ~20 copies/cell
hexamer
RNApol primase for leading S,
dna C acts with dnaB 25kd
dna G primase for lagging S,60kd ~ 25
(Okazaki fragment ) monomer
SSB Binding with S.S.DNA 74kd ~300
Prevents from anneal monomer
Elongate genes
dnaE DNA polymerase III(α) 140kd ~20
dnaZ DNA polymerase III(β) 52kd ~20
polA DNA polymerase I 109kd ~400
polB DNA polymerase II 90-120kd ~100
Topoisomerase
rep Relaxed protein (Helicase)
D.S,DNA → S.S,DNA
ATPase 1H-bond / 2 ATP
lig Ligase
HDP Helix De-stabilizing Protein
No ATPase activity
Binding S,S,DNA
decrease Tm
Prevents from anneal
b) DNA polymerase in Prokaryote
PolA polB dnaE dnaZ
109kd 120kd >250kd
I II III
mutation
lethal lethal
3’ →5’ editing
mismatch 10-8 10-3 yes
5’ → 3’ exonuclease
small fragment repair No No
α(主要酶类 ) β γ
Maxi,pol Mini,pol
Nuclei Nuclei mt
120-300 kd 30-50 kd 150-300kd
polymerize 5’ → 3’ yes yes
editing 3’ → 5’ No No
RNA primer No No
No No DNA primer
2000-6000mole,/ cell
● DNA polymerase in Eukaryote
m5C
a) DNA中 m5C的特点
● 对 MspI,HpaII 位点的高频修饰
MspI HpaII
CmC GG
C CmGG +
HNH
H
4
1
5 3
6 2 O
H
N
NCH3
4.7,DNA Methylation (m5C in Eukaryote)
● Animal 70% of CG seq,
Plant CNG seq,of Nuclei DNA
(mtDNA,cpDNA no m5C)
● Eukaryote
High repetitive seq,frequent m5C
Structure gene rare m5C
Cluster gene frequent m5
Expressing gene rare m5C
Closed gene frequent m5C
( in GC island of promoter )
b) Function of m5C
细胞分化,组织特化,阶段发育,组织培养过程的脱分化与
m5C的相关性( 5-氨胞苷去甲基化的作用)
m5C---甲基化是生物自我保护的机制
m5C 的不足 基因表达相关
m5C的丰富 基因关闭相关
m5C 的程度具有明显的组织,细胞的特异性 (时空性 )
(杂种优势理论的研究 …… )
m5C-----使 Z-DNA在体内趋于稳定状态
● m5C 与基因突变的关系
C → m5C → T → gene mutation (癌变 )
HNH
5
O
C
G
CH3
5
HNH
O
O
CH3
5
O
氧化脱氨
m5C
G
T
A
启动子区 m5C T
设计引物研究基因表达与性状的相关