转位因子 (transposable
element)
? 可移动的基因成分,指能在一个 DNA分
子内部或两个 DNA分子之间移动的片段。
在细菌中可指在质粒和染色体之间或在
质粒和质粒之间移动的片段。
? 类型,1、插入序列( insertion
sequence,IS)
? 2、转座子( transposon,Tn)
? 3、转座的噬菌体( transposable phage )
Insertion sequence
? 一类简单转位因子,长度约 700~2000bp,
由一个转位酶基因及两侧的反向重复序
列( inverted repeat sequence,IR)组成,不
带任何其它基因。
? 转位时复制宿主靶位点一小段 DNA
( 4~15bp)形成两端的正向重复序列。
? 反转重复( inverted repeated):由反方向互补的
两个 DNA片段组成,两个反转重复序列又叫 回
文序列 (palindrome sequence)。
? 镜像重复 (mirror repeat):由反方向完全相同的
两个序列组成。
? 直接重复 (direct repeat),由同一方向完全相同
的两个序列组成。正向重复序列、顺向重复序
列。
转座子( transposon)
? 一类较大的可移动成分。除有关转座的
基因外,至少带有一个与转座作用无关
并决定宿主菌遗传性状的基因。
? 转座子中的转位酶常称为转座酶,其功
能是介导转座子插入到 DNA的其它部位。
? 复合型 Tn:由一个基因序列及两侧臂组
成。两侧臂为 IS序列。
? TnA族 T n:两端是正向或反向重复序列,中间
有与 Tn功能相关的基因(编码转座酶)及抗生
素抗性基因。总是作为一个单位进行转座,其
末端不能单独转座。
? 接合型 Tn:
Transposable phage
? 具有转座功能的溶源性噬菌体,包括 Mu
和 D108等。
Eukaryote Genome
? 基因组结构与功能的特点
? 基因组结构
? 人类基因组的组织结构特征
? 人类基因组计划
真核生物基因组结构与功能
的特点
? 1、含两份同源的基因组
? 2、结构复杂,基因数庞大,具有许多复
制起点,每个复制子大小不一。
? 3、真核基因由一个结构基因与相关的调
控区组成,转录产物为单顺反子。
? 4、含有大量重复序列。
? 5、非编码序列( non-coding sequence
NCS)占 90%以上。
? 6、断裂基因( split gene)。基因与基因间
的非编码序列为间隔 DNA( spacer DNA).
? 7、功能相关的基因构成各种基因家族,
可串联在一起,也可相距很远。
? 8、可移动因素( mobile genetic element),
又称为自私基因( selfish DNA).
真核生物基因组的结构
? 结构基因
? 顺式作用元件( cis-acting element)
? 基因家族 (gene family)
? 重复序列 (repeat sequence)
? 端粒 (telomere)
Cis-acting elements
? 指与结构基因表达调控相关、能够被基
因调控蛋白特异性识别和结合的 DNA序
列 。并非都位于转录起始点上游,包括
启动子、增强子、上游启动子元件、反
应元件、加尾信号等。
? 反式作用因子 ( trans-acting elements),
可通过结合顺式作用元件而调节基因转
录活性的蛋白质因子。
启动子( promoter)
? 是 RNA聚合酶特异性识别和结合的 DNA
序列,位于结构基因转录起始点的上游 -
25bp处,本身不被转录。
? 启动子必须与转录因子结合才能被 RNA
聚合酶识别与结合。
? TATA盒。
上游启动子元件( upstream
promoter elements)
? TATA盒上游的一些特定的 DNA序列,
反式作用因子能与这些元件结合调控基
因的转录效率。
? 上游启动子元件包括 CAAT盒,CACA盒
及 GC 盒 。
? CAAT盒,5`GCNCAATCT3`
? GC盒,5`CCGCC3`
? CACA盒,GCCACACCC
反应元件( response element)
? 一些信息分子的受体被细胞外信息分子
激活后,能与特异的 DNA序列结合,调
控基因的表达。由于能介导基因对细胞
外的某种信号产生反应,称为反应元件。
? 具有较短的保守序列。糖皮质激素反应
元件( GRE)序列为:
GGTACANNTGTTCT。
增强子( enhancer)
? 是一段 DNA序列,其中含有多个能被反
式作用因子识别与结合的顺式作用元件,
能调控(常为增强)邻近基因的转录。
? 一般位于转录起始点上游 -100~-300bp处,
但在基因外或某些内含子中也有增强子
序列。
? 负增强子( negative enhancer)又称沉默子
( silencer):负调控序列。
加尾信号
? 结构基因的最后一个外显子中有一个保
守序列 AATAAA与下游一段 GT丰富区或
T丰富区共同构成 polyA加尾信号。
? 与 RNA聚合酶结合的延长因子能识别这
种结构并与之结合,然后在 AAUAAA下
游 10~30个碱基的部位切断 RNA并加上
polyA 尾巴。
基因家族( gene family)
? 指核苷酸序列或编码产物的结构具有一
定程度同源性的一组基因。
? 假基因( pseudogene),在多基因家族中
有的成员并不能表达出有功能的产物,
用 ψ表示。
球蛋白基因
? 基因超家族( gene superfamily)指一组由
多基因家族及单基因组成的更大的基因
家族,它们的结构有不同的同源性,但
功能并不一定相同。如免疫球蛋白基因
超家族。
重复序列( repeat sequence)
? 1, 高度重复序列,重复次数 >105的 DNA
序列如卫星 DNA和反向重复序列。
? 2,中度重复序列,重复次数为 101~105。
? 3,单拷贝序列,大多数编码蛋白质的结
构基因属这一类。
端粒( telomere)
? 以线性染色体形式存在的真核基因组
DNA的末端的一种特殊结构,是一段
DNA序列和蛋白质形成的一种复合体。
保守序列,TTAGGG重复序列,
人类基因组的重复序列
? 1,反向重复序列( inverted repeats),5%
? 2、串联重复序列( tandem repeats):具有一
个固定的重复单位,头尾相连。 10%
( 1)编码区串联重复顺序
( 2)非编码区串联重复顺序
3,散在重复顺序( interspersed repeats)
反向重复序列 ( inverted
repeats)
? 指两个顺序相同的互补拷贝在 DNA链上呈反向
排列。一种形式为两个反向排列的拷贝之间隔
着一段间隔顺序如:
5`AAACCACCGCTGGTAGCGGTGGTTT3`
3`TTTGGTGGCGACCATCGCCACCAAA5`
另一种是两个拷贝反向串联在一起,也称为回文
结构( palindrome).
串联重复序列( tandem
repeats):
? 1、编码区串联重复顺序,如组蛋白基因。
编码五种组蛋白的基因密集在一个基本
的 7.0kb的重复单位上,各重复单位之间
有高度的序列一致性。
? 2、非编码区串联重复顺序,常存在于间
隔 DNA和内含子内。是组成卫星 DNA
( satellite DNA)的基础。
卫星 DNA( satellite DNA)
? 如果 DNA分子之间存在浮力密度的差异,在氯
化铯密度梯度离心将会沉降于不同的位置。
? DNA的浮力密度( ρ)与其 G-C含量存在关系:
ρ=1.660+0.00098(G-C%)。
? 因此经过密度梯度离心,高度重复序列 DNA可
以在基因组 DNA的主带旁形成一条或多条小带,
这取决于其 G-C含量及重复程度,故又称为 卫
星 DNA或随机 DNA。
?根据核心顺序的长短分为 大卫星 DNA、小卫
星 DNA、微卫星 DNA。
? 大卫星 DNA( macrosatellite DNA)又称为
经典 DNA。总长度 100kb~几个 Mb。根据
浮力密度的不同分为 Ⅰ, Ⅱ, Ⅲ, Ⅳ 和 α、
β卫星 DNA。各类型都由不同的重复顺序
家族组成。
? 小卫星 DNA( minisatellite DNA)由中等
大小 的串联重复序列构成,总长约
0.1~20kb,分布在所有染色体,往往近于
端粒处。高度可变的卫星 DNA、端粒
DNA(串联的短片段重复序列
( TTAGGGG)n
? 微卫星 DNA( microsatellite DNA):重复单
位为 1~5 bp,重复次数为 10~60次,总长
度小于 150bp,常见以 (AC)n和 (TG)n二聚
核苷酸为重复单位,由 Miesfeld 1981年发
现。
3kb
人类基因组 DNA的多态性
? DNA位点多态性( DNA site
polymorphism)
? 限制性片段长度多态性( restriction
fragment length polymorphism RFLP)
? 串联重复顺序多态性( tandem repeats
polymorphism)
DNA位点多态性( DNA site
polymorphism)
? 由于等位基因间在特定位点上 DNA序列
存在差异造成的。 ABO血型组是发现的
第一个人类多态性。
? 人类白细胞抗原( HLA)是最复杂最具
多态性的体系,位于 6 号染色体。仅其中
的 DR抗原编码位点有 60多个等位基因。
限制性片段长度多态性
( RFLP)
? 用同一种限制酶消化不同个体的 DNA时,会得
到长度各不相同的限制性片段类型。当碱基组
成的变化改变了限制性内切酶识别位点时,就
会得到不同的限制性片段类型,这样的位点称
为多态性位点。
? 通过限制酶酶切片段的长度多态性来揭示 DNA
碱基组成不同的技术称为限制性片段长度多态
性技术 ( RFLP技术) 。
? PFLP的基础是高度重复序列和点突变。
串联重复顺序多态性
? 重复单位很小,但重复次数有较大的变化,主
要发生在小卫星 DNA和微卫星 DNA中,也称为
可变数目的串联重复序列 ( variable number of
tandem repeats VNTRS)。
? 小卫星 DNA多态性:由于重复单位的数目不同
引起。
? 微卫星 DNA多态性:由于重复单位的重复次数
不同而具有高度的遗传多态性。