第九章 基因工程和基因组学遗传工程或基因工程,是将分子遗传学的理论与技术相结合,用来改造、创建动、植物新品种,工业化生产生物产品,诊断和治疗人类遗传疾病的一个新领域。
本章介绍 遗传工程的基本原理和方法,基因组学的发展及应用前景。
广义 遗传工程包括,
生化工程、蛋白质工程、细胞工程、染色体工程、
细胞器工程、基因工程及酶工程等。
狭义 遗传工程是指,
基因工程 (重组 DNA技术 )。
一、基因工程概述,
第一节 基因工程
1,概念:
基因工程,在分子水平上,采取工程建设方式? 按照预先设计的蓝图? 借助于实验室技术将某种生物的基因或基因组转移到另一种生物中去? 使 后者定向获得新遗传性状的一门技术。
基因工程技术的建立,使所有实验生物学领域产生巨大的变革。
基因工程是采用分子生物学、核酸生物化学以及微生物遗传学的现代方法和手段建立起来的综合技术。
2,发展:
1971年,Smith等人从细菌中分离出的一种 限制性酶,酶切病毒 DNA分子,标志着 DNA重组时代的开始。
1972年,Berg等用限制性酶分别 酶切 猿猴病毒和 l噬菌体
DNA,将两种 DNA分子用 连接酶 连接起来? 得到新的 DNA分子。
1973年,Cohen等进一步将酶切后的 DNA分子与质粒 DNA
连接起来,并将 重组质粒 转入 E,cloi细胞中。
1982年,美国食品卫生和医药管理局批准,用 基因工程在细菌中生产人的胰岛素 投放市场。
1985年,转基因植物 获得成功。
1994年,延熟保鲜的 转基因番茄 商品生产。
1996年,克隆羊 诞生。
1996年 全世界转基因植物种植面积为 170万公顷,1997年 为
1100万公顷,1998年 为 2780万公顷,1999年 达到 3990万公顷,
2000年 达到 4420万公顷,2001年 达到 5260万公顷,2002年 达到 5000万公顷。
2001年种植面积已超过 100万公顷的作物有:
大豆 ( 3330万 hm2,占全世界转基因作物的 63%,均为抗除草剂大豆),玉米 ( 980万 hm2,占 19% ),棉花
( 680万 hm2,占 13% ),油菜 ( 270万 hm2,5% );
其它还有 水稻、小麦、花生、向日葵、亚麻、甘蓝、马铃薯等,番茄、烟草、南瓜和木瓜等 50多种转基因作物已实现商品化。
主要分布 在美国( 3570万 hm2)、阿根廷( 1180万 hm2)、
加拿大( 320万 hm2)和中国( 150万 hm2)等国。
2001年全世界转基因作物占相应种植总面积的百分率
2001年 我国 的转基因农作物和林木 已达 22种,其中转基因棉花、大豆、马铃薯、烟草、玉米、花生、菠菜、
甜椒、小麦等进行了田间试验,转基因棉花已经大规模商品化生产 。
3.内容:
①,从细胞和组织中 分离 DNA;
②,限制性内切酶酶切 DNA分子,制备 DNA片段 ;
③,将酶切 DNA分子与载体 DNA连接?构建能在宿主细胞内自我复制的 重组 DNA分子 ;
④,把重组 DNA分子引入宿主受体细胞?复制;
⑤,重组 DNA随宿主细胞的分裂而分配到子细胞?建立无性繁殖系 (Clone)或 发育成个体 ;
⑥,从细胞群体中 选出所需要的无性繁殖系?并使外源基因在受体细胞中正常表达,翻译成蛋白质等 基因产物,回收; 或 筛选出获得定向的性状变异的 个体 。
1,限制性内切酶 (restriction enzyme):
一种水解 DNA的磷酸二脂酶,遗传工程中重要工具。
这种酶 能识别 双链 DNA分子中一段特异的核苷酸序列,
在这一段序列内将双链 DNA分子切断。
细菌细胞中存在 限制修饰系统,
限制,降解外源 DNA,防御异源遗传信息进入的手段。
修饰,修饰外源 DNA片段后,保留在新细胞中。
二、限制性内切核酸酶限制性内切酶 EcoRⅠ,
识别序列,回纹 对称序列 (palindrome),不同生物的 DNA具有相同识别序列。
酶切方式,以交错 方式切断
DNA双链,产生二个相同的 单链粘性末端。
重组过程,两种片段在适宜条件下,可经碱酸二脂链,
连接成重组 DNA分子 。
⑴,限制性内切酶的命名:
根据其来自的生物名称,用英文字母和数字表示;
②,HindⅢ 来自 Haemophilus influenzae。
①,EcoRI 来自 Escherichia coli;
⑵,限制性内切酶的类别:
第 Ⅰ 类酶,每隔一段 DNA序列随机切割双链 DNA分子,
没有序列特异性,酶切位点不定 。
如 EcoB(大肠杆菌 B株 ),EcoK(大肠杆菌 K株 )分子量较大
(约 300000),作用时需 ATP,Mg++等辅助因子。
第 Ⅱ 类酶,能识别一段特异的 DNA序列,准确地酶切双链 DNA的特异序列。
如 EcoRI(大肠杆菌 ),HindⅢ( 嗜血杆菌 ),分子量较小 (约
20000-100000),作用时需 Mg2+存在。
第 Ⅱ 类酶特点:
(1) 切割产生 平末端 (blunt ends)
如 Sma Ⅰ,
(2) 有的产生粘性末端从两个方向阅读而序列相同的序列。
识别特定碱基顺序,为回文对称序列,又称反向重复序列:
如 EcoRⅠ,
载体,将“目的”基因导入受体细胞的运载工具。
DNA片段与适合的载体 DNA连接构成重组 DNA? 在载体 DNA的运载下,高效率地进入宿主细胞,并在其中进行复制。
DNA载体,质粒、噬菌体、病毒、细菌或酵母菌人工染色体等。
三、载体( vector):
载体的条件:
①,具有复制原点,能 自我复制 ;
②,具 多克隆位点 (multiple
cloningsite,MCS 或
Polylinker region)即有多种限制酶的切点;
③,选择时的 遗传标记,如抗生素基因;
④,易 从宿主细胞中 回收 。
㈠,细菌质粒:
质粒 是细菌细胞内独立于细菌染色体而自然存在的、
能自我复制、易分离和导入的环状双链 DNA分子。
质粒具有 重组表型检测标记,检测是否携带外源 DNA
片段。
在细胞内的复制程度:
严紧型,一个细菌细胞内的质粒数量有 1-2个;
松驰型,每个细胞内有的 20-60个。
如 pUC18质粒具有以下特点:
③,克隆位点的酶切位点多,
克隆方便;
④,具有 a-互补的 显色表型,用于检测重组质粒的选择标记。
①,分子量小,可接受较大外源片段;
②,拷贝数多,每个细胞中有 500个;
噬菌体 DNA中间约 2/3的序列为中间基因簇,位于两端的为 DNA左、右臂。 中间基因簇 可被外源 DNA替代而不影响浸染细菌的能力。
能接受 15-23kb外源
DNA片段,可以作为 cDNA或核 DNA克隆的载体。
㈡,λ 噬菌体 (温和型 ):
基因组全长 49kb。
优点:
2.不易引起生物危害,有助于“目的”基因进入细胞并增殖 ;
1.携带 大片段 外源 DNA分子,可占用总量的 25%时仍不失活。
㈢,柯斯质粒 (cosmid):
部分 λ噬菌体 DNA + 部分细菌 质粒 DNA序列组建? 柯斯质粒 。
带有噬菌体 cos序列和细菌质粒复制原点、抗生素抗性标记。
这种质粒分子量较小,但可接受 长达 50kb的外源
DNA片段,在克隆 真核 生物基因中十分有用。
∵ 一个长片段 DNA可能具有真核生物基因的编码序列及其它调控序列。
指能在 两种不同 的生物中复制的载体。
如能在 原核 生物(如 E,coli),真核 细胞(如酵母)
中复制的载体。
穿梭载体需 同时具有 细菌质粒的复制原点、真核生物自主复制序列 (Auto-nomously replicating sequence,
ARS)以及两者的选择标记。
㈣,穿梭载体( shuttle vectors):
穿梭载体 在细菌 中用于克隆、扩增基因,在酵母菌中 用于基因表达分析。
酵母菌的 YEp (yeast
episomaplasmid)和 YRp
系列载体 均是穿梭载体。
穿梭质粒 YEp24
㈤,细菌人工染色体 (Bacterial artificial chromosome,BAC)
BAC载体 可以 携带大于 50kb的外源 DNA片段 。
特点:
带有外源 DNA的 BAC载体在细胞中是单拷贝的;
载体本身分子量很小 (7.4kb);
选择标记,氯霉素抗性基因;
多克隆位点。
F因子经基因工程改造成 BAC载体,可用于克隆 100kb以上的 DNA片段。
㈥,酵母人工染色体 (yeast artificial chromosome,YAC):
YAC具有自主复制序列、克隆位点和可在细菌和酵母菌中选择的标记基因;还具有酵母菌染色体一些特点; 可接受 100-1000kb的外源 DNA片段。
YAC已成为人类基因组计划和图位克隆基因的重要工具;
并促进了 人类人工染色体 (human artificial chromosome
,HAC)的研究。
1996年完成了酵母菌全基因组序列的测定
㈦,Ti质粒及其衍生载体:
适合于 植物 的载体系统?将重组 DNA运载到植物细胞并使目的基因表达。
Ti质粒 是一种细菌质粒,它自然存在于 土壤农杆菌 (革兰氏阴菌 )(Agrobacterium tumefaciens)细胞中?可诱导植物产生瘤细胞 (tumor-Inducing,Ti)?冠瘿瘤
(grown galltumors)。
Ti质粒一部分 DNA叫 转移 DNA
(transfer DNA,T-DNA),当农杆菌感染植物时,T-DNA便转移到植物的染色体上,诱导冠瘿瘤,并能合成冠瘿碱 (opine),
作为农杆菌的碳源和氮源。
农杆菌感染产生冠缨瘤一般而言,一个基因? 是编码一条多肽链的一个 DNA片段,包括启动子、终止子及内含子等。
在 DNA重组技术出现之前,由于 DNA分子量大而结构单一,DNA是细胞中最难分析的大分子。
DNA重组技术发展成功 之后,DNA已成为细胞中最易操作分析的大分子。
四、基因的分离与鉴定:
利用这一技术,可从一个含有 10万个基因的大基因组中,准确地分离出 特异的 单个目的基因 。
分离与鉴定基因是 DNA重组中的关键步骤之一。
分离的基因可用于 分析基因序列、结构与表达,
又可为基因工程 提供目的基因 。
1.体外通过 限制性内切酶 的修剪和 DNA连接酶 的连接;
2.目标 DNA分子 + 载体 DNA,共价连接;
3.获得 重组 DNA分子 。
DNA的体外重组:
㈠,从基因库中分离基因:
1.构建 基因库( library)
基因库 是一组 DNA和 cDNA序列克隆的集合体。
根据克隆核酸序列、来源,基因库可分为,
核基因库,染色体库,cDNA库,线粒体库 等。
①,核基因库:
核基因库 (genomic library),将 某生物全部基因组 DNA 酶切后与载体连接构建而成的。理想的核基因库应能包括全部基因组序列。
构建文库可采用不同的载体:
质粒载体,重组质粒导入感受态细胞,收集所有菌落。
噬菌体或 (柯斯质粒 )载体,重组 DNA包装进噬菌体,
感染细菌,收集噬菌斑。
BAC(细菌人工染色体 )或 YAC(酵母人工染色体 )载体,重组人工染色体,导入相应宿主细胞,收集所有细胞,即为基因库 。
②,染色体基因库:
将基因组的 一部分如一条染色体 用来构建基因库?
可 选择 特异基因以及分析染色体结构和组织。
果蝇的多线染色体中,对染色体进行 微切割,构建染色体区段基因文库。如对 X染色体上多线染色体带的分析。
人类基因组项目研究中,利用 流动细胞分离 (flow
cytometry)技术将人类染色体分开,用于 构建单个染色体基因库,大大加速了人类基因组作图和分析。
流式细胞分离原理分离后的染色体进行涂色验证酵母菌:
利用改良的 脉冲电泳方法 (pulsed field gel electro -
phoresis,PFGE),将酵母菌 16根染色体 据其分子量大小分开 后,用于构建染色体库,在基因组分析中发挥作用。
③,cDNA库:
以 mRNA为模板?经反转录酶合成互补 DNA?构建基因库。
真核生物 mRNA的 5’ 端具有一段多聚 A尾端序列?得到的双链 DNA分子经两端补齐后?以带有限制性酶切点的人工接头连接?酶切后与载体 (通常是噬菌体 )
连接?制备 cDNA库。
cDNA库与核 DNA库不同:
cDNA库仅具有细胞或组织内 表达 基因的 mRNA序列?仅包括基因组的 部分基因序列。
cDNA库对于 研究基因的表达模式、分离某一特定基因是十分有用的 。
通常是将 cDNA库与核基因库配合使用,以便既能得到基因的编码序列,又可得到基因的调控序列。
2,筛选基因库:
根据待选基因相关信息? 确定筛选方法和条件
从基因库中筛选、分离基因。
多数方法 是利用一段核苷酸序列 (DNA,cDNA或寡聚核苷酸 )或抗体 作探针 (Probe),用放射性同位素或非放射性同位素 标记探针? 筛选 基因库。
筛库过程:
将转化或转染后菌落印影在滤膜上?用碱裂解、中和后洗涤烘干
再用目的基因的放射性 DNA或 mRNA作探针进行杂交放射性自显影?凡黑点菌落即为阳性克隆 。
①,限制性酶图谱:
构建 阳性克隆 的限制性酶图谱? 根据同源性分析,
可了解阳性克隆片段的 酶切位点及相对位置? 用于进一步 亚克隆或 同已知的其它 序列比较 。
3,阳性克隆的分析与鉴定:
从基因库中筛选出的阳性克隆? 分析、鉴定? 得到目的基因。
图示,一个 15kb DNA片段的限制性酶图谱构建方法 。
将阳性克隆 DNA分装 3个管中?酶切 DNA?琼脂糖凝胶电泳?溴化乙锭染色?紫外灯下见到 DNA带。
从凝胶电泳结果分析:
模式 Ⅱ 就是这个 15kb DNA片段用上述两种酶酶切后的 限制性酶图谱 。
用类似的方法,将不同 DNA用限制性酶消化,
根据其 产生的多型性,即限制性酶片段长度的多型性?来分析 DNA水平的变异程度,以 RFLP作为分子标记进行基因组图谱分析。
②,核酸分子杂交:
Southern杂交分析,由英国的
Southern发明 (1975),一种 将琼脂糖中的 DNA转移到 尼龙膜?
进行 DNA分子杂交 分析的方法。
筛选基因库得到 阳性克隆 后?
将限制性酶酶切与 Southern杂交结合?绘制限制性酶图谱。
Northern杂交分析,与 Sorthern杂交相同的原理和程序。
用于分析克隆的基因在某一细胞或组织的转录水平,检测 mRNA的存在 。
Western 杂交分析:
用于 蛋白质 的分析 。
③,核酸序列测定克隆后的 DNA片段进行核酸序列测定后?确定该 DNA片段序列的正确性。
一般采用 Sanger(1977)发明的 双脱氧核糖核酸终止法 测定核酸序列。
在 Sanger双脱氧法中,可用荧光标记来代替放射性标记:
④,核酸序列分析:
测定的核酸序列是否为基因、有什么功能,需用计算机软件或生物学实验进一步分析。
( 1) 同源性比较将待测序列在核酸和蛋白质两个水平上 比较基因间的同源性,将序列发送到 Blast等 DNA Data数据库进行比较。
核酸序列分析方法:
对于那些同已知序列无任何同源性的新序列,可能还要进行基因功能性研究。
一个 ORF是一条能编码一条多肽链的 DNA序列,具有翻译起始信号和终止信号等。
( 2)分析核酸序列的 阅读框架
PCR反应三个步聚 (一个循环 ):
1,变性,94-95℃ 使模板 DNA双链变成单链;
2,复性,50-70℃ 下,引物分别与互补的
DNA单链互补配对;
3,延伸,在引物的引导和 Taq酶作用下,
于 72 ℃ 下合成模板 DNA的互补链。
PCR反应通常有 25-35个循环,一般可 扩增 5kb左右的片段。
由该技术衍生出一些新的技术,如 RAPD
和 AFLP等技术。
㈡,PCR扩增基因:
聚合酶链式反应 (polymerase
chainReaction,PCR)可以体外快速扩增
DNA。美国 Mullis(1986)发明,是现代生物学发展史上的一个 里程碑 。
㈢,人工合成基因:
根据已知的基因或氨基酸序列,将化学合成寡核苷酸的方法与 酶促合成 DNA的方法结合 起来?可很快地人工合成基因。
如 SOE-PCR技术?可扩增出完整的基因序列。
1,化学合成的寡聚核苷酸 (80-100个核苷酸 )?通过 SOE将单链部分补齐;
2,PCR扩增 DNA片段;
3,DNA变性;
4,两个单链部分经 SOE补齐?双链;
5,PCR扩增 DNA,利用多级 SOE-PCR
扩增出完整的基因。
目前,基因工程研究发展迅速,已取得一系列重大突破。
基因工程技术已 广泛用于 工业、农业、畜牧业、医学、
法学等领域,为人类创造了巨大的财富。
五、基因工程的应用:
具有生长激素的转基因鼠转基因的方法和技术,
㈠,基因工程工业:
最早应用基因工程生产人的蛋白质的方法是 在细菌中表达人的胰岛素 (1982)。
胰岛素是一种控制糖代谢的蛋白质激素。不能产生胰岛素的患者会有糖尿病,患者必须每天注射胰岛素。
现已在细菌中生产 10多种 医药产品,如表皮生长因子、人生长激素因子、干扰素、乙型肝类工程疫苗等。
有些 真核细胞 的蛋白质需要 糖基化等修饰加工 以后才具有活性,而细菌细胞缺少真核细胞的这些修饰系统
真核生物细胞更适合于表达真核生物蛋白质基因。
目前,酵母菌,植物悬浮细胞,
植株和动物培养细胞 成功地均应用于表达 外源蛋白。
基因工程应用大肠杆菌生产人类生长激素
㈡,植物基因工程:
植物基因转化 是指将外源基因转移到植物细胞内、并整合到植物基因组中稳定遗传和表达的过程。
许多植物基因已经被分离、克隆。植物基因转化技术也得到不断发展和完善。应用最多的为 农杆菌转化法和 基因枪转化法 。
抗虫稻 对照
1,根癌农杆菌转化技术:
根癌农杆菌 介导的植物转化是应用得最早而广泛的植物转化方法(双子叶植物、单子叶植物)。
过程,将目的基因与启动子(花椰菜病毒 35S)及终止子组成嵌合 DNA分子?插入到 Ti衍生质粒 RB与 LB内构成 重组质粒? 再转化到 农杆菌 细胞? 将重组农杆菌去 感染 植物细胞? 使质粒的部分 DNA包括目的基因,整合到植物染色体,实现 遗传转化。
利用从 抗草甘磷 (glyphosate) E,coli中分离克隆的
EPSP合成酶基因,已培育出高抗除草剂转基因植物 。
基因枪介导的植物转化是通过高压气体为动力,
高速 发射包裹有重组 DNA的 金属颗粒?将目的基因直接导入植物细胞,并整合到染色体上的方法。
2,基因枪转化技术:
转化的载体多数是以 pUC系列质粒 为基础构建的。
它们通常具有 细菌复制原点 及 抗性选择标记,具有可在植物中表达的启动子终止子及调控序列,以及植物抗性选择标记 (如除草剂、潮霉素等抗性 )。
几种基因枪类型的 共同特点,是用一种 动力系统 将金属微粒和包被 DNA导入受体细胞或组织进行转化。
1,位于高压气体桶底部的 爆破片 ;
2,载有重组 DNA和金属微粒的 大载体 ;
3,阻挡板 ;
4,包裹有重组 DNA的 金属微粒 ;
5,被轰击 样品 。
㈢,转基因动物,
与转基因植物相比,转基因动物的发展要慢些。
转基因动物,目的基因 +载体?重组 DNA?微量注射法将重组 DNA导入受体合子细胞核中?遗传转化。
如,利用转基因羊,大量表达人类的 抗胰蛋白酶 。
可分泌人类生长 因子 Ⅸ 的转基因羊,Polly” (下图 )。
(Wilmut等,Nature 385,
1997)
受精卵细胞注射法转基因牛:受精卵注射法人类生长激素转基因猪同胞鼠对照转移有人类生长激素转基因鼠
㈣,遗传疾病诊断:
利用重组 DNA技术进行遗传疾病诊断,是直接从
DNA即基因水平进行诊断?准确度高,速度快。
进行 产前诊断,分析胎儿是否有遗传疾病。
如:镰刀性贫血病的诊断
㈤,基因治疗:
利用基因工程技术,将 特异基因导入并整合到有遗传缺陷患者的基因组中?治疗遗传疾病,通常叫做 基因治疗 (gene therapy)。
方法,利用 减毒的病毒 DNA作载体 (retro virus DNA)?
构建重组 DNA分子?用病毒包装物包装后形成的减毒病毒感染患者的细胞?将正常基因整合到染色体上。
例如,用 漠洛尼氏鼠 白血病病毒 (MLV)改造而成的 retro
virus载体,已用于治疗严重 综合免疫缺陷 (SCID)。
SCID是由于 腺苷脱氢酶基因 (adenosine deaminase,ADA)
突变 引起的,患者无任何免疫功能。
方法,将 ADA基因导入到 MLV retrovirus 载体中?取代该病毒 DNA中的 三个基因结构 (gag,pol,env)?将重组后的病毒去感染 T细胞,使 ADA基因整合到 T细胞的染色体中?实现基因治疗的目的。
2000年法国 Fischer用该方法治愈患有 SCID遗传病的两个婴儿 (8个月和 11个月 ) 。
这一工作被认为是 20世纪人类基因治疗上的重大突破。
㈥,DNA芯片 (DNA chips),
核酸分子杂交的原理和方法 +半导体技术结合?发展形成的一门新技术。这一技术可使许多分子杂交反应同时进行。
DNA芯片技术:
在面积不大 (如 2cm2 )的基片表面分成不同小格?有序地点阵排列于一定位置可寻址的核苷酸分子?将 待分析核苷酸 分子标记 (如用荧光 ),变性成单链与芯片上序列相同的核苷酸分子杂交?与芯片上序列不同的核酸分子被洗掉?
利用高精度的激光扫描仪记录分子已杂交的荧光信号?计算机软件分析。
DNA芯片的 基片,玻璃、硅片或尼龙等。
应用领域:
基因多态性检测 (如单核苷酸多态性筛选 single
nucleotidePolymorphisms,SNPs) ;
基因表达分析 (不同细胞和不同组织的 RNA群体比较);
克隆选择及文库筛选 (如 cDNA文库);
基因突变检测及遗传病和肿瘤的诊断等 。
第二节 基因组学基因组学 (genomics ),
遗传学研究进入分子水平后发展起来的一个分支,主要研究生物体内基因组的分子特征 。
研究对象:
以 整个基因组 为研究单位,而 不以单个基因 为单位作为研究对象。
研究目标,
认识 基因组的结构、功能和进化;
阐明 整个基因组所包含的遗传信息和相互关系;
充分 利用 有效资源,预防和治疗人类疾病。
重要组成部分:
基因组计划 (genome project)大体上可分为:
⒈ 构建 基因组的 遗传图谱 ;
⒉ 构建 基因组的 物理图谱 ;
⒊ 测定 基因组 DNA的 全部序列 ;
⒋ 绘制 基因组的 转录本图谱 ;
⒌ 分析 基因组的 功能 。
基因组计划研究开始于 1990年 。
美国 启动被誉为“人体阿波罗计划”的,人类基因组计划,,投资 30亿美元,历时 15年?测定 人类基因组的 30亿个核苷酸对 的排列次序?构建 高分辨率的人类基因组遗传图谱和物理图谱?发展 生物信息学。
在美国提出人类基因组计划后,日本 和 中国 分别于 1991年和 1992年启动了“水稻基因组计划”。
由于以人类为对象的研究实际上受到诸多限制,
也受 伦理学 的约束,所以人类基因组计划还将对有关的模式生物,如酵母、线虫、果蝇、小鼠、家猪、拟南芥等进行相应的研究,为 研究人类基因组 的战略提供重要的 依据。
2002年 4月 5日,Science,以 14页的篇幅刊登和宣布中国科学家独立绘制完成水稻基因组草图序列( 总数,4.6亿 ),是继人类基因组工作草图( 2001年春 )之后完成测定的最大基因组。 ( 2001年 12月 14
日美、英等国科学家宣布绘制出拟南芥基因组的完整图谱)
材料,籼稻。
完成单位,华大基因研究中心,中科院遗传与发育生物学研究所等 12
个单位,2001年 7月启动。
水平,水稻基因组中的总基因数约为 46022~55615个( 接近人类基因数的两倍 ),工作框架图序列已覆盖水稻 整个基因组 92% 以上的基因 。
方法:,鸟枪射击法”,利用国产曙光 2000、曙光 3000超级计算机 (1000
亿次 /秒 )对随机 DNA碎片进行排序和组装,确定其在基因组的正确位置。
计划,功能基因分析和蛋白质研究。
2002年 11月 21日,Nature,宣布中国科学家独立绘制完成 粳稻基因组第四号染色体 精确测序图,使我国对国际水稻基因组测序计划贡献率达到 10%。
材料,粳稻“日本晴”。
完成单位,中科院国家基因研究中心等 4家单位。
整个国际水稻基因组计划始于 1998年,日本、美国、中国、法国等国家和地区参加。
水平,第四号染色体中的 总碱基数目为 0.35亿碱基对,覆盖了该染色体全长序列 98% 的区域,只剩下 7个小空洞,测序碱基序列的精确度达到 99.99%。完整测定的 着丝粒序列 在高等生物中属于首次。
计划,对预测鉴定的 4658个 基因作进一步分析、着丝粒功能等研究。
一、基因组图谱的构建解决方法,大规模序列测定前,构建 基因组图谱 可作为序列测定中制定测序方案的依据,以便锚定测知的核酸序列在染色体上的位置。
基因组中核苷酸顺序的测定方法:
小基因组 物种常用 鸟枪法测序法 。
大基因组测序存在两个问题:
片段数 (n)庞大,片段间连接和装配非常复杂;
基因组中相同或相似的重复序列在连接和装配时 容易出错。
测序方法:
克隆连续序列法 (clone contig),将基因组 DNA切割长度为 0.1Mb-1Mb的大片段?克隆到 YAC或 BAC载体上?分别测定单个克隆的序列?再装配连接成连续的 DNA分子。
定向鸟枪射击法 (directed shotgun),以基因组图谱中标记为依据?测序装配和构建不同 DNA片段的序列。
基因组图谱根据构建的途径,可分为两种:
遗传图谱,根据 遗传性状 (如已知基因位点、功能未知的
DNA标记、可鉴别的表型性状 )的 分离比例?将其定位在基因组中,构建相应的连锁图谱。
物理图谱,将 各种标记 直接定位 在基因库中的某一点上。
㈠,遗传图谱的构建:
1.图谱标记,可用基因和 DNA作为 可鉴别的标记 (mark)。
缺点,基因数目有限、所构建的遗传图谱不详细、标记间的遗传距离较大。
⑵,DNA标记:
每种生物 DNA具有稳定性,∴ DNA本身可作为构建遗传图谱的标记,主要有以下 3种类型:
①,限制性内切酶多型性,
②,简单序列长度多型性
③,单核苷酸多型性
⑴,基因标记,
基因控制性状的表现,所以也就是利用可以鉴别的形态、生化等表型性状作标记,
2、遗传图谱的构建:
⑴,人类基因组遗传图谱的构建:
家系分析法,分析 8个家系 134个成员 (186个减数分裂 )?
根据 5264个 STR(简单重复序列 )标记绘制而成(对于 X染色体,另外利用 12家系的 170个成员分析 (105个减数分裂 ))
将 5264个标记定位在 2335个位点?构建的人类基因组遗传图谱密度为 每个标记 599 Kb。
⑵,植物基因组遗传图谱的构建:
①,选择亲本:
要求亲缘关系远,遗传差异性大,亲本间分子标记具有多态性。
②,产生构图群体:
配制杂交组合,建立分离群体:
利用回交或三交 (复交 )产生的后代群体。
单交组合产生的 F2;
衍生的 F3,F4家系;
由连续多代自交或姊妹交产生的重组近交系 (recombinantinbred
Lines,RIL);,
通过单倍体加倍而成的双倍体
(doubled haploids,DH);,
③,遗传标记的染色体定位:
有 单体,三体,代换系 与 附加系 分析等方法,依据染色体剂量的差异?将遗传标记定位在特定染色体上。即当供体材料总 DNA等量时,DNA杂交带的信号强弱与该标记位于的染色体剂量成正比。
④,标记间的连锁分析:
通过分析分离群体内双亲间有 多态性的遗传标记间的连锁交换情况和趋于协同分离 的程度?即可确定标记间的连锁关系和遗传距离。
(二 )、物理图谱的构建:
1,构建物理图谱的原因:
⑴,遗传图谱的分辩率有限:
⑵,遗传图谱的精确性不高:
2,构建物理图谱的三条途径:
⑴,限制性酶图谱:
利用限制性内切酶绘制图谱,对于 DNA分子长度 <50Kb的片段,一般没有什么困难。而对于 >50Kb的 DNA分子,可选用稀有切点内切酶酶切 DNA。
⑵,荧光原位杂交是另一物理图谱构建方法?通过荧光标记的探针与 DNA分子杂交,使染色体上的 杂交信号( 位置就是探针 DNA在染色体上的图谱位点 )在显微镜下可直接观察 。
⑶,序列标签位点:
利用某一 已知序列为标签的位点 (sequence tagged sites,
STS)作探针,与基因组 DNA杂交,绘制物理图谱。
3,人类基因组物理图谱,
人类基因组序列开始测定时,已有 45万个 EST,其中有一些重复序列,经计算机分析筛选后得到 49625个,各代表一个基因。再从中筛选出 3万个 EST、二个 辐射杂交系库 (分别有 83和 93个细胞株)、一个有 32000个克隆的 YAC
文库用于构建图谱 。
结果构建的物理图谱的密度为 每个标记 183kb,EST分布结果表明基因在染色体上的排列是不均匀的。
将上述 遗传图谱 及其它 物理图谱 整合?构成更加完整的人类其因组图谱,作为基因组序列测定的框架和分析的依据。
二、基因组图谱的应用:
基因组图谱中除了构建遗传图谱和物理图谱外,还可进一步 根据标记类型 细分为不同的称谓。
如 RFLP图谱,RAPD图谱,AFLP图谱等,目前已在拟南芥、
番茄、水稻等 30多种植物中构建了基因图谱 。
基因图谱的构建除了进行测序之外,还有许多的用途。
1,基因定位:
借助基因组图谱,可使基因定位在精度、深度、广度等方面有极大的提高。已陆续在各种农作物上定位了许多重要农艺性状 和 经济性状 的基因,
在复杂 数量性状位点
(quantitative trait loci,
QTL) 定位分析方面,也取得了很大进展。
2,基因组比较分析:
已经在 禾本科 玉米、水稻、高梁、大麦、小麦和黑麦,
茄科的蕃茄、胡椒、马铃薯,十字花科 拟南芥、甘蓝、花椰菜、油菜等做了遗传图谱比较分析,从分子水平了解物种间同源性,研究 基因组的进化 和 染色体的演变 。
3,标记辅助选择 (marker-assisted selection MAS):
饱和基因组图谱可用来确定与任何一个目的基因 紧密连锁的分子标记?根据图谱间接选择目的基因,可降低连锁累赘,加速目的基因的转移与利用,提高回交育种的效率。
4,基因的克隆与分离:
根据饱和的基因组图谱,可以找到 一个与目的基因紧密连锁的分子标记,作为 染色体步行 (chromosome
walking)起始点?进行基因的克隆和分离,此法亦称图位克隆法 (map-based cloning),为基因产物未知的基因克隆提供了捷径。
是在完成基因组图谱构建以及全部序列测定的基础上?进一步研究全基因组的 基因功能,基因之间 相互关系 和 调控机制 为主要内容的学科。
目前人类基因组计划已测定了人类基因组序列中 85%
以上的核苷酸序列,将计划完成 全序列测定 的时间从 2005
年提前到 2003年。 2001年 4月 26日,公布了人类基因序列框架草图。
三、后基因组学 (post-genomics ),
自从 1996年酵母菌基因组全序列测定 以来,全世界已有
1000多个实验室,5000多名科学家从事酵母菌后基因组学的研究,共发表论文 7000多篇,鉴定 1060个新基因的功能,但仍然还有约 1600个阅读框架的功能不清楚。
后基因组学主要技术:
DNA微列阵技术;
蛋白质组学;
酵母菌双杂交系统;
生物信息学等技术。
1,DNA微列阵 (DNA microarrays),
是利用 DNA芯片技术?同时进行大量分子杂交,分析比较不同组织或器官的基因表达水平,筛选突变基因,从 核酸水平 分析基因表达模式。
2,蛋白质组学 (proteomics ),
是 从蛋白质水平来研究基因组的基因表达?
分析基因组的蛋白质类型、数量、空间结构变异以及相互作用的机制。
蛋白质组学比基因组学更为复杂,
∵ 真核生物的基因表达受转录因子控制,转录因子需与启动子区域的 DNA结合?并激活 RNA聚合酶转录。
转录因子具有 DNA结合 及 激活转录 两功能,分别由不同区域完成,而且将这两部分 分割成两个片段 后仍由互作?
能装配成一个完全有功能的转录因子。
基于这一特点,设计出酵母双杂交系统。
是利用酵母菌同一个细胞中共同表达不同蛋白质,以鉴定蛋白质之间互作 的一种分析方法。
3,酵母菌双杂交系统 (two hybrid-systems),
4,生物信息学 (bioinformatics ),
是一种用 计算机 贮存原始资料,分析生物信息,将
DNA芯片以及蛋白质双向电泳结果转变成为可读的遗传学信息的学科。
生物信息学是 现代生物技术与计算机科学的结合,收集、加工和分析生物资料和信息。
生物信息学 是在未来生命科学中起关键作用的学科之一。
应用生物信息学 可以将来不同的基因组理论和应用综合并标准化,利用大量的生物信息资料来 了解 遗传网络系统,信号传递 及 相互关系,计算机还可进行一些 生物模拟 研究。
∴ 利用生物信息学能够 分析 从微生物、植物以及人类基因组序列测定产生的大量资料?阐明 遗传信息。
1.遗传工程:
细胞工程中核移植与体细胞克隆技术。
本章小结载体条件与限制性内切酶;
目的基因获取与体外重组;
转基因技术及其应用;
2.基因组学:
后基因组学,DNA芯片技术、蛋白质组学、生物信息学等。
基因图谱构建,遗传图谱和物理图谱的构建;
基因图谱应用,基因定位、比较基因组学,MAS、基因克隆;
本章介绍 遗传工程的基本原理和方法,基因组学的发展及应用前景。
广义 遗传工程包括,
生化工程、蛋白质工程、细胞工程、染色体工程、
细胞器工程、基因工程及酶工程等。
狭义 遗传工程是指,
基因工程 (重组 DNA技术 )。
一、基因工程概述,
第一节 基因工程
1,概念:
基因工程,在分子水平上,采取工程建设方式? 按照预先设计的蓝图? 借助于实验室技术将某种生物的基因或基因组转移到另一种生物中去? 使 后者定向获得新遗传性状的一门技术。
基因工程技术的建立,使所有实验生物学领域产生巨大的变革。
基因工程是采用分子生物学、核酸生物化学以及微生物遗传学的现代方法和手段建立起来的综合技术。
2,发展:
1971年,Smith等人从细菌中分离出的一种 限制性酶,酶切病毒 DNA分子,标志着 DNA重组时代的开始。
1972年,Berg等用限制性酶分别 酶切 猿猴病毒和 l噬菌体
DNA,将两种 DNA分子用 连接酶 连接起来? 得到新的 DNA分子。
1973年,Cohen等进一步将酶切后的 DNA分子与质粒 DNA
连接起来,并将 重组质粒 转入 E,cloi细胞中。
1982年,美国食品卫生和医药管理局批准,用 基因工程在细菌中生产人的胰岛素 投放市场。
1985年,转基因植物 获得成功。
1994年,延熟保鲜的 转基因番茄 商品生产。
1996年,克隆羊 诞生。
1996年 全世界转基因植物种植面积为 170万公顷,1997年 为
1100万公顷,1998年 为 2780万公顷,1999年 达到 3990万公顷,
2000年 达到 4420万公顷,2001年 达到 5260万公顷,2002年 达到 5000万公顷。
2001年种植面积已超过 100万公顷的作物有:
大豆 ( 3330万 hm2,占全世界转基因作物的 63%,均为抗除草剂大豆),玉米 ( 980万 hm2,占 19% ),棉花
( 680万 hm2,占 13% ),油菜 ( 270万 hm2,5% );
其它还有 水稻、小麦、花生、向日葵、亚麻、甘蓝、马铃薯等,番茄、烟草、南瓜和木瓜等 50多种转基因作物已实现商品化。
主要分布 在美国( 3570万 hm2)、阿根廷( 1180万 hm2)、
加拿大( 320万 hm2)和中国( 150万 hm2)等国。
2001年全世界转基因作物占相应种植总面积的百分率
2001年 我国 的转基因农作物和林木 已达 22种,其中转基因棉花、大豆、马铃薯、烟草、玉米、花生、菠菜、
甜椒、小麦等进行了田间试验,转基因棉花已经大规模商品化生产 。
3.内容:
①,从细胞和组织中 分离 DNA;
②,限制性内切酶酶切 DNA分子,制备 DNA片段 ;
③,将酶切 DNA分子与载体 DNA连接?构建能在宿主细胞内自我复制的 重组 DNA分子 ;
④,把重组 DNA分子引入宿主受体细胞?复制;
⑤,重组 DNA随宿主细胞的分裂而分配到子细胞?建立无性繁殖系 (Clone)或 发育成个体 ;
⑥,从细胞群体中 选出所需要的无性繁殖系?并使外源基因在受体细胞中正常表达,翻译成蛋白质等 基因产物,回收; 或 筛选出获得定向的性状变异的 个体 。
1,限制性内切酶 (restriction enzyme):
一种水解 DNA的磷酸二脂酶,遗传工程中重要工具。
这种酶 能识别 双链 DNA分子中一段特异的核苷酸序列,
在这一段序列内将双链 DNA分子切断。
细菌细胞中存在 限制修饰系统,
限制,降解外源 DNA,防御异源遗传信息进入的手段。
修饰,修饰外源 DNA片段后,保留在新细胞中。
二、限制性内切核酸酶限制性内切酶 EcoRⅠ,
识别序列,回纹 对称序列 (palindrome),不同生物的 DNA具有相同识别序列。
酶切方式,以交错 方式切断
DNA双链,产生二个相同的 单链粘性末端。
重组过程,两种片段在适宜条件下,可经碱酸二脂链,
连接成重组 DNA分子 。
⑴,限制性内切酶的命名:
根据其来自的生物名称,用英文字母和数字表示;
②,HindⅢ 来自 Haemophilus influenzae。
①,EcoRI 来自 Escherichia coli;
⑵,限制性内切酶的类别:
第 Ⅰ 类酶,每隔一段 DNA序列随机切割双链 DNA分子,
没有序列特异性,酶切位点不定 。
如 EcoB(大肠杆菌 B株 ),EcoK(大肠杆菌 K株 )分子量较大
(约 300000),作用时需 ATP,Mg++等辅助因子。
第 Ⅱ 类酶,能识别一段特异的 DNA序列,准确地酶切双链 DNA的特异序列。
如 EcoRI(大肠杆菌 ),HindⅢ( 嗜血杆菌 ),分子量较小 (约
20000-100000),作用时需 Mg2+存在。
第 Ⅱ 类酶特点:
(1) 切割产生 平末端 (blunt ends)
如 Sma Ⅰ,
(2) 有的产生粘性末端从两个方向阅读而序列相同的序列。
识别特定碱基顺序,为回文对称序列,又称反向重复序列:
如 EcoRⅠ,
载体,将“目的”基因导入受体细胞的运载工具。
DNA片段与适合的载体 DNA连接构成重组 DNA? 在载体 DNA的运载下,高效率地进入宿主细胞,并在其中进行复制。
DNA载体,质粒、噬菌体、病毒、细菌或酵母菌人工染色体等。
三、载体( vector):
载体的条件:
①,具有复制原点,能 自我复制 ;
②,具 多克隆位点 (multiple
cloningsite,MCS 或
Polylinker region)即有多种限制酶的切点;
③,选择时的 遗传标记,如抗生素基因;
④,易 从宿主细胞中 回收 。
㈠,细菌质粒:
质粒 是细菌细胞内独立于细菌染色体而自然存在的、
能自我复制、易分离和导入的环状双链 DNA分子。
质粒具有 重组表型检测标记,检测是否携带外源 DNA
片段。
在细胞内的复制程度:
严紧型,一个细菌细胞内的质粒数量有 1-2个;
松驰型,每个细胞内有的 20-60个。
如 pUC18质粒具有以下特点:
③,克隆位点的酶切位点多,
克隆方便;
④,具有 a-互补的 显色表型,用于检测重组质粒的选择标记。
①,分子量小,可接受较大外源片段;
②,拷贝数多,每个细胞中有 500个;
噬菌体 DNA中间约 2/3的序列为中间基因簇,位于两端的为 DNA左、右臂。 中间基因簇 可被外源 DNA替代而不影响浸染细菌的能力。
能接受 15-23kb外源
DNA片段,可以作为 cDNA或核 DNA克隆的载体。
㈡,λ 噬菌体 (温和型 ):
基因组全长 49kb。
优点:
2.不易引起生物危害,有助于“目的”基因进入细胞并增殖 ;
1.携带 大片段 外源 DNA分子,可占用总量的 25%时仍不失活。
㈢,柯斯质粒 (cosmid):
部分 λ噬菌体 DNA + 部分细菌 质粒 DNA序列组建? 柯斯质粒 。
带有噬菌体 cos序列和细菌质粒复制原点、抗生素抗性标记。
这种质粒分子量较小,但可接受 长达 50kb的外源
DNA片段,在克隆 真核 生物基因中十分有用。
∵ 一个长片段 DNA可能具有真核生物基因的编码序列及其它调控序列。
指能在 两种不同 的生物中复制的载体。
如能在 原核 生物(如 E,coli),真核 细胞(如酵母)
中复制的载体。
穿梭载体需 同时具有 细菌质粒的复制原点、真核生物自主复制序列 (Auto-nomously replicating sequence,
ARS)以及两者的选择标记。
㈣,穿梭载体( shuttle vectors):
穿梭载体 在细菌 中用于克隆、扩增基因,在酵母菌中 用于基因表达分析。
酵母菌的 YEp (yeast
episomaplasmid)和 YRp
系列载体 均是穿梭载体。
穿梭质粒 YEp24
㈤,细菌人工染色体 (Bacterial artificial chromosome,BAC)
BAC载体 可以 携带大于 50kb的外源 DNA片段 。
特点:
带有外源 DNA的 BAC载体在细胞中是单拷贝的;
载体本身分子量很小 (7.4kb);
选择标记,氯霉素抗性基因;
多克隆位点。
F因子经基因工程改造成 BAC载体,可用于克隆 100kb以上的 DNA片段。
㈥,酵母人工染色体 (yeast artificial chromosome,YAC):
YAC具有自主复制序列、克隆位点和可在细菌和酵母菌中选择的标记基因;还具有酵母菌染色体一些特点; 可接受 100-1000kb的外源 DNA片段。
YAC已成为人类基因组计划和图位克隆基因的重要工具;
并促进了 人类人工染色体 (human artificial chromosome
,HAC)的研究。
1996年完成了酵母菌全基因组序列的测定
㈦,Ti质粒及其衍生载体:
适合于 植物 的载体系统?将重组 DNA运载到植物细胞并使目的基因表达。
Ti质粒 是一种细菌质粒,它自然存在于 土壤农杆菌 (革兰氏阴菌 )(Agrobacterium tumefaciens)细胞中?可诱导植物产生瘤细胞 (tumor-Inducing,Ti)?冠瘿瘤
(grown galltumors)。
Ti质粒一部分 DNA叫 转移 DNA
(transfer DNA,T-DNA),当农杆菌感染植物时,T-DNA便转移到植物的染色体上,诱导冠瘿瘤,并能合成冠瘿碱 (opine),
作为农杆菌的碳源和氮源。
农杆菌感染产生冠缨瘤一般而言,一个基因? 是编码一条多肽链的一个 DNA片段,包括启动子、终止子及内含子等。
在 DNA重组技术出现之前,由于 DNA分子量大而结构单一,DNA是细胞中最难分析的大分子。
DNA重组技术发展成功 之后,DNA已成为细胞中最易操作分析的大分子。
四、基因的分离与鉴定:
利用这一技术,可从一个含有 10万个基因的大基因组中,准确地分离出 特异的 单个目的基因 。
分离与鉴定基因是 DNA重组中的关键步骤之一。
分离的基因可用于 分析基因序列、结构与表达,
又可为基因工程 提供目的基因 。
1.体外通过 限制性内切酶 的修剪和 DNA连接酶 的连接;
2.目标 DNA分子 + 载体 DNA,共价连接;
3.获得 重组 DNA分子 。
DNA的体外重组:
㈠,从基因库中分离基因:
1.构建 基因库( library)
基因库 是一组 DNA和 cDNA序列克隆的集合体。
根据克隆核酸序列、来源,基因库可分为,
核基因库,染色体库,cDNA库,线粒体库 等。
①,核基因库:
核基因库 (genomic library),将 某生物全部基因组 DNA 酶切后与载体连接构建而成的。理想的核基因库应能包括全部基因组序列。
构建文库可采用不同的载体:
质粒载体,重组质粒导入感受态细胞,收集所有菌落。
噬菌体或 (柯斯质粒 )载体,重组 DNA包装进噬菌体,
感染细菌,收集噬菌斑。
BAC(细菌人工染色体 )或 YAC(酵母人工染色体 )载体,重组人工染色体,导入相应宿主细胞,收集所有细胞,即为基因库 。
②,染色体基因库:
将基因组的 一部分如一条染色体 用来构建基因库?
可 选择 特异基因以及分析染色体结构和组织。
果蝇的多线染色体中,对染色体进行 微切割,构建染色体区段基因文库。如对 X染色体上多线染色体带的分析。
人类基因组项目研究中,利用 流动细胞分离 (flow
cytometry)技术将人类染色体分开,用于 构建单个染色体基因库,大大加速了人类基因组作图和分析。
流式细胞分离原理分离后的染色体进行涂色验证酵母菌:
利用改良的 脉冲电泳方法 (pulsed field gel electro -
phoresis,PFGE),将酵母菌 16根染色体 据其分子量大小分开 后,用于构建染色体库,在基因组分析中发挥作用。
③,cDNA库:
以 mRNA为模板?经反转录酶合成互补 DNA?构建基因库。
真核生物 mRNA的 5’ 端具有一段多聚 A尾端序列?得到的双链 DNA分子经两端补齐后?以带有限制性酶切点的人工接头连接?酶切后与载体 (通常是噬菌体 )
连接?制备 cDNA库。
cDNA库与核 DNA库不同:
cDNA库仅具有细胞或组织内 表达 基因的 mRNA序列?仅包括基因组的 部分基因序列。
cDNA库对于 研究基因的表达模式、分离某一特定基因是十分有用的 。
通常是将 cDNA库与核基因库配合使用,以便既能得到基因的编码序列,又可得到基因的调控序列。
2,筛选基因库:
根据待选基因相关信息? 确定筛选方法和条件
从基因库中筛选、分离基因。
多数方法 是利用一段核苷酸序列 (DNA,cDNA或寡聚核苷酸 )或抗体 作探针 (Probe),用放射性同位素或非放射性同位素 标记探针? 筛选 基因库。
筛库过程:
将转化或转染后菌落印影在滤膜上?用碱裂解、中和后洗涤烘干
再用目的基因的放射性 DNA或 mRNA作探针进行杂交放射性自显影?凡黑点菌落即为阳性克隆 。
①,限制性酶图谱:
构建 阳性克隆 的限制性酶图谱? 根据同源性分析,
可了解阳性克隆片段的 酶切位点及相对位置? 用于进一步 亚克隆或 同已知的其它 序列比较 。
3,阳性克隆的分析与鉴定:
从基因库中筛选出的阳性克隆? 分析、鉴定? 得到目的基因。
图示,一个 15kb DNA片段的限制性酶图谱构建方法 。
将阳性克隆 DNA分装 3个管中?酶切 DNA?琼脂糖凝胶电泳?溴化乙锭染色?紫外灯下见到 DNA带。
从凝胶电泳结果分析:
模式 Ⅱ 就是这个 15kb DNA片段用上述两种酶酶切后的 限制性酶图谱 。
用类似的方法,将不同 DNA用限制性酶消化,
根据其 产生的多型性,即限制性酶片段长度的多型性?来分析 DNA水平的变异程度,以 RFLP作为分子标记进行基因组图谱分析。
②,核酸分子杂交:
Southern杂交分析,由英国的
Southern发明 (1975),一种 将琼脂糖中的 DNA转移到 尼龙膜?
进行 DNA分子杂交 分析的方法。
筛选基因库得到 阳性克隆 后?
将限制性酶酶切与 Southern杂交结合?绘制限制性酶图谱。
Northern杂交分析,与 Sorthern杂交相同的原理和程序。
用于分析克隆的基因在某一细胞或组织的转录水平,检测 mRNA的存在 。
Western 杂交分析:
用于 蛋白质 的分析 。
③,核酸序列测定克隆后的 DNA片段进行核酸序列测定后?确定该 DNA片段序列的正确性。
一般采用 Sanger(1977)发明的 双脱氧核糖核酸终止法 测定核酸序列。
在 Sanger双脱氧法中,可用荧光标记来代替放射性标记:
④,核酸序列分析:
测定的核酸序列是否为基因、有什么功能,需用计算机软件或生物学实验进一步分析。
( 1) 同源性比较将待测序列在核酸和蛋白质两个水平上 比较基因间的同源性,将序列发送到 Blast等 DNA Data数据库进行比较。
核酸序列分析方法:
对于那些同已知序列无任何同源性的新序列,可能还要进行基因功能性研究。
一个 ORF是一条能编码一条多肽链的 DNA序列,具有翻译起始信号和终止信号等。
( 2)分析核酸序列的 阅读框架
PCR反应三个步聚 (一个循环 ):
1,变性,94-95℃ 使模板 DNA双链变成单链;
2,复性,50-70℃ 下,引物分别与互补的
DNA单链互补配对;
3,延伸,在引物的引导和 Taq酶作用下,
于 72 ℃ 下合成模板 DNA的互补链。
PCR反应通常有 25-35个循环,一般可 扩增 5kb左右的片段。
由该技术衍生出一些新的技术,如 RAPD
和 AFLP等技术。
㈡,PCR扩增基因:
聚合酶链式反应 (polymerase
chainReaction,PCR)可以体外快速扩增
DNA。美国 Mullis(1986)发明,是现代生物学发展史上的一个 里程碑 。
㈢,人工合成基因:
根据已知的基因或氨基酸序列,将化学合成寡核苷酸的方法与 酶促合成 DNA的方法结合 起来?可很快地人工合成基因。
如 SOE-PCR技术?可扩增出完整的基因序列。
1,化学合成的寡聚核苷酸 (80-100个核苷酸 )?通过 SOE将单链部分补齐;
2,PCR扩增 DNA片段;
3,DNA变性;
4,两个单链部分经 SOE补齐?双链;
5,PCR扩增 DNA,利用多级 SOE-PCR
扩增出完整的基因。
目前,基因工程研究发展迅速,已取得一系列重大突破。
基因工程技术已 广泛用于 工业、农业、畜牧业、医学、
法学等领域,为人类创造了巨大的财富。
五、基因工程的应用:
具有生长激素的转基因鼠转基因的方法和技术,
㈠,基因工程工业:
最早应用基因工程生产人的蛋白质的方法是 在细菌中表达人的胰岛素 (1982)。
胰岛素是一种控制糖代谢的蛋白质激素。不能产生胰岛素的患者会有糖尿病,患者必须每天注射胰岛素。
现已在细菌中生产 10多种 医药产品,如表皮生长因子、人生长激素因子、干扰素、乙型肝类工程疫苗等。
有些 真核细胞 的蛋白质需要 糖基化等修饰加工 以后才具有活性,而细菌细胞缺少真核细胞的这些修饰系统
真核生物细胞更适合于表达真核生物蛋白质基因。
目前,酵母菌,植物悬浮细胞,
植株和动物培养细胞 成功地均应用于表达 外源蛋白。
基因工程应用大肠杆菌生产人类生长激素
㈡,植物基因工程:
植物基因转化 是指将外源基因转移到植物细胞内、并整合到植物基因组中稳定遗传和表达的过程。
许多植物基因已经被分离、克隆。植物基因转化技术也得到不断发展和完善。应用最多的为 农杆菌转化法和 基因枪转化法 。
抗虫稻 对照
1,根癌农杆菌转化技术:
根癌农杆菌 介导的植物转化是应用得最早而广泛的植物转化方法(双子叶植物、单子叶植物)。
过程,将目的基因与启动子(花椰菜病毒 35S)及终止子组成嵌合 DNA分子?插入到 Ti衍生质粒 RB与 LB内构成 重组质粒? 再转化到 农杆菌 细胞? 将重组农杆菌去 感染 植物细胞? 使质粒的部分 DNA包括目的基因,整合到植物染色体,实现 遗传转化。
利用从 抗草甘磷 (glyphosate) E,coli中分离克隆的
EPSP合成酶基因,已培育出高抗除草剂转基因植物 。
基因枪介导的植物转化是通过高压气体为动力,
高速 发射包裹有重组 DNA的 金属颗粒?将目的基因直接导入植物细胞,并整合到染色体上的方法。
2,基因枪转化技术:
转化的载体多数是以 pUC系列质粒 为基础构建的。
它们通常具有 细菌复制原点 及 抗性选择标记,具有可在植物中表达的启动子终止子及调控序列,以及植物抗性选择标记 (如除草剂、潮霉素等抗性 )。
几种基因枪类型的 共同特点,是用一种 动力系统 将金属微粒和包被 DNA导入受体细胞或组织进行转化。
1,位于高压气体桶底部的 爆破片 ;
2,载有重组 DNA和金属微粒的 大载体 ;
3,阻挡板 ;
4,包裹有重组 DNA的 金属微粒 ;
5,被轰击 样品 。
㈢,转基因动物,
与转基因植物相比,转基因动物的发展要慢些。
转基因动物,目的基因 +载体?重组 DNA?微量注射法将重组 DNA导入受体合子细胞核中?遗传转化。
如,利用转基因羊,大量表达人类的 抗胰蛋白酶 。
可分泌人类生长 因子 Ⅸ 的转基因羊,Polly” (下图 )。
(Wilmut等,Nature 385,
1997)
受精卵细胞注射法转基因牛:受精卵注射法人类生长激素转基因猪同胞鼠对照转移有人类生长激素转基因鼠
㈣,遗传疾病诊断:
利用重组 DNA技术进行遗传疾病诊断,是直接从
DNA即基因水平进行诊断?准确度高,速度快。
进行 产前诊断,分析胎儿是否有遗传疾病。
如:镰刀性贫血病的诊断
㈤,基因治疗:
利用基因工程技术,将 特异基因导入并整合到有遗传缺陷患者的基因组中?治疗遗传疾病,通常叫做 基因治疗 (gene therapy)。
方法,利用 减毒的病毒 DNA作载体 (retro virus DNA)?
构建重组 DNA分子?用病毒包装物包装后形成的减毒病毒感染患者的细胞?将正常基因整合到染色体上。
例如,用 漠洛尼氏鼠 白血病病毒 (MLV)改造而成的 retro
virus载体,已用于治疗严重 综合免疫缺陷 (SCID)。
SCID是由于 腺苷脱氢酶基因 (adenosine deaminase,ADA)
突变 引起的,患者无任何免疫功能。
方法,将 ADA基因导入到 MLV retrovirus 载体中?取代该病毒 DNA中的 三个基因结构 (gag,pol,env)?将重组后的病毒去感染 T细胞,使 ADA基因整合到 T细胞的染色体中?实现基因治疗的目的。
2000年法国 Fischer用该方法治愈患有 SCID遗传病的两个婴儿 (8个月和 11个月 ) 。
这一工作被认为是 20世纪人类基因治疗上的重大突破。
㈥,DNA芯片 (DNA chips),
核酸分子杂交的原理和方法 +半导体技术结合?发展形成的一门新技术。这一技术可使许多分子杂交反应同时进行。
DNA芯片技术:
在面积不大 (如 2cm2 )的基片表面分成不同小格?有序地点阵排列于一定位置可寻址的核苷酸分子?将 待分析核苷酸 分子标记 (如用荧光 ),变性成单链与芯片上序列相同的核苷酸分子杂交?与芯片上序列不同的核酸分子被洗掉?
利用高精度的激光扫描仪记录分子已杂交的荧光信号?计算机软件分析。
DNA芯片的 基片,玻璃、硅片或尼龙等。
应用领域:
基因多态性检测 (如单核苷酸多态性筛选 single
nucleotidePolymorphisms,SNPs) ;
基因表达分析 (不同细胞和不同组织的 RNA群体比较);
克隆选择及文库筛选 (如 cDNA文库);
基因突变检测及遗传病和肿瘤的诊断等 。
第二节 基因组学基因组学 (genomics ),
遗传学研究进入分子水平后发展起来的一个分支,主要研究生物体内基因组的分子特征 。
研究对象:
以 整个基因组 为研究单位,而 不以单个基因 为单位作为研究对象。
研究目标,
认识 基因组的结构、功能和进化;
阐明 整个基因组所包含的遗传信息和相互关系;
充分 利用 有效资源,预防和治疗人类疾病。
重要组成部分:
基因组计划 (genome project)大体上可分为:
⒈ 构建 基因组的 遗传图谱 ;
⒉ 构建 基因组的 物理图谱 ;
⒊ 测定 基因组 DNA的 全部序列 ;
⒋ 绘制 基因组的 转录本图谱 ;
⒌ 分析 基因组的 功能 。
基因组计划研究开始于 1990年 。
美国 启动被誉为“人体阿波罗计划”的,人类基因组计划,,投资 30亿美元,历时 15年?测定 人类基因组的 30亿个核苷酸对 的排列次序?构建 高分辨率的人类基因组遗传图谱和物理图谱?发展 生物信息学。
在美国提出人类基因组计划后,日本 和 中国 分别于 1991年和 1992年启动了“水稻基因组计划”。
由于以人类为对象的研究实际上受到诸多限制,
也受 伦理学 的约束,所以人类基因组计划还将对有关的模式生物,如酵母、线虫、果蝇、小鼠、家猪、拟南芥等进行相应的研究,为 研究人类基因组 的战略提供重要的 依据。
2002年 4月 5日,Science,以 14页的篇幅刊登和宣布中国科学家独立绘制完成水稻基因组草图序列( 总数,4.6亿 ),是继人类基因组工作草图( 2001年春 )之后完成测定的最大基因组。 ( 2001年 12月 14
日美、英等国科学家宣布绘制出拟南芥基因组的完整图谱)
材料,籼稻。
完成单位,华大基因研究中心,中科院遗传与发育生物学研究所等 12
个单位,2001年 7月启动。
水平,水稻基因组中的总基因数约为 46022~55615个( 接近人类基因数的两倍 ),工作框架图序列已覆盖水稻 整个基因组 92% 以上的基因 。
方法:,鸟枪射击法”,利用国产曙光 2000、曙光 3000超级计算机 (1000
亿次 /秒 )对随机 DNA碎片进行排序和组装,确定其在基因组的正确位置。
计划,功能基因分析和蛋白质研究。
2002年 11月 21日,Nature,宣布中国科学家独立绘制完成 粳稻基因组第四号染色体 精确测序图,使我国对国际水稻基因组测序计划贡献率达到 10%。
材料,粳稻“日本晴”。
完成单位,中科院国家基因研究中心等 4家单位。
整个国际水稻基因组计划始于 1998年,日本、美国、中国、法国等国家和地区参加。
水平,第四号染色体中的 总碱基数目为 0.35亿碱基对,覆盖了该染色体全长序列 98% 的区域,只剩下 7个小空洞,测序碱基序列的精确度达到 99.99%。完整测定的 着丝粒序列 在高等生物中属于首次。
计划,对预测鉴定的 4658个 基因作进一步分析、着丝粒功能等研究。
一、基因组图谱的构建解决方法,大规模序列测定前,构建 基因组图谱 可作为序列测定中制定测序方案的依据,以便锚定测知的核酸序列在染色体上的位置。
基因组中核苷酸顺序的测定方法:
小基因组 物种常用 鸟枪法测序法 。
大基因组测序存在两个问题:
片段数 (n)庞大,片段间连接和装配非常复杂;
基因组中相同或相似的重复序列在连接和装配时 容易出错。
测序方法:
克隆连续序列法 (clone contig),将基因组 DNA切割长度为 0.1Mb-1Mb的大片段?克隆到 YAC或 BAC载体上?分别测定单个克隆的序列?再装配连接成连续的 DNA分子。
定向鸟枪射击法 (directed shotgun),以基因组图谱中标记为依据?测序装配和构建不同 DNA片段的序列。
基因组图谱根据构建的途径,可分为两种:
遗传图谱,根据 遗传性状 (如已知基因位点、功能未知的
DNA标记、可鉴别的表型性状 )的 分离比例?将其定位在基因组中,构建相应的连锁图谱。
物理图谱,将 各种标记 直接定位 在基因库中的某一点上。
㈠,遗传图谱的构建:
1.图谱标记,可用基因和 DNA作为 可鉴别的标记 (mark)。
缺点,基因数目有限、所构建的遗传图谱不详细、标记间的遗传距离较大。
⑵,DNA标记:
每种生物 DNA具有稳定性,∴ DNA本身可作为构建遗传图谱的标记,主要有以下 3种类型:
①,限制性内切酶多型性,
②,简单序列长度多型性
③,单核苷酸多型性
⑴,基因标记,
基因控制性状的表现,所以也就是利用可以鉴别的形态、生化等表型性状作标记,
2、遗传图谱的构建:
⑴,人类基因组遗传图谱的构建:
家系分析法,分析 8个家系 134个成员 (186个减数分裂 )?
根据 5264个 STR(简单重复序列 )标记绘制而成(对于 X染色体,另外利用 12家系的 170个成员分析 (105个减数分裂 ))
将 5264个标记定位在 2335个位点?构建的人类基因组遗传图谱密度为 每个标记 599 Kb。
⑵,植物基因组遗传图谱的构建:
①,选择亲本:
要求亲缘关系远,遗传差异性大,亲本间分子标记具有多态性。
②,产生构图群体:
配制杂交组合,建立分离群体:
利用回交或三交 (复交 )产生的后代群体。
单交组合产生的 F2;
衍生的 F3,F4家系;
由连续多代自交或姊妹交产生的重组近交系 (recombinantinbred
Lines,RIL);,
通过单倍体加倍而成的双倍体
(doubled haploids,DH);,
③,遗传标记的染色体定位:
有 单体,三体,代换系 与 附加系 分析等方法,依据染色体剂量的差异?将遗传标记定位在特定染色体上。即当供体材料总 DNA等量时,DNA杂交带的信号强弱与该标记位于的染色体剂量成正比。
④,标记间的连锁分析:
通过分析分离群体内双亲间有 多态性的遗传标记间的连锁交换情况和趋于协同分离 的程度?即可确定标记间的连锁关系和遗传距离。
(二 )、物理图谱的构建:
1,构建物理图谱的原因:
⑴,遗传图谱的分辩率有限:
⑵,遗传图谱的精确性不高:
2,构建物理图谱的三条途径:
⑴,限制性酶图谱:
利用限制性内切酶绘制图谱,对于 DNA分子长度 <50Kb的片段,一般没有什么困难。而对于 >50Kb的 DNA分子,可选用稀有切点内切酶酶切 DNA。
⑵,荧光原位杂交是另一物理图谱构建方法?通过荧光标记的探针与 DNA分子杂交,使染色体上的 杂交信号( 位置就是探针 DNA在染色体上的图谱位点 )在显微镜下可直接观察 。
⑶,序列标签位点:
利用某一 已知序列为标签的位点 (sequence tagged sites,
STS)作探针,与基因组 DNA杂交,绘制物理图谱。
3,人类基因组物理图谱,
人类基因组序列开始测定时,已有 45万个 EST,其中有一些重复序列,经计算机分析筛选后得到 49625个,各代表一个基因。再从中筛选出 3万个 EST、二个 辐射杂交系库 (分别有 83和 93个细胞株)、一个有 32000个克隆的 YAC
文库用于构建图谱 。
结果构建的物理图谱的密度为 每个标记 183kb,EST分布结果表明基因在染色体上的排列是不均匀的。
将上述 遗传图谱 及其它 物理图谱 整合?构成更加完整的人类其因组图谱,作为基因组序列测定的框架和分析的依据。
二、基因组图谱的应用:
基因组图谱中除了构建遗传图谱和物理图谱外,还可进一步 根据标记类型 细分为不同的称谓。
如 RFLP图谱,RAPD图谱,AFLP图谱等,目前已在拟南芥、
番茄、水稻等 30多种植物中构建了基因图谱 。
基因图谱的构建除了进行测序之外,还有许多的用途。
1,基因定位:
借助基因组图谱,可使基因定位在精度、深度、广度等方面有极大的提高。已陆续在各种农作物上定位了许多重要农艺性状 和 经济性状 的基因,
在复杂 数量性状位点
(quantitative trait loci,
QTL) 定位分析方面,也取得了很大进展。
2,基因组比较分析:
已经在 禾本科 玉米、水稻、高梁、大麦、小麦和黑麦,
茄科的蕃茄、胡椒、马铃薯,十字花科 拟南芥、甘蓝、花椰菜、油菜等做了遗传图谱比较分析,从分子水平了解物种间同源性,研究 基因组的进化 和 染色体的演变 。
3,标记辅助选择 (marker-assisted selection MAS):
饱和基因组图谱可用来确定与任何一个目的基因 紧密连锁的分子标记?根据图谱间接选择目的基因,可降低连锁累赘,加速目的基因的转移与利用,提高回交育种的效率。
4,基因的克隆与分离:
根据饱和的基因组图谱,可以找到 一个与目的基因紧密连锁的分子标记,作为 染色体步行 (chromosome
walking)起始点?进行基因的克隆和分离,此法亦称图位克隆法 (map-based cloning),为基因产物未知的基因克隆提供了捷径。
是在完成基因组图谱构建以及全部序列测定的基础上?进一步研究全基因组的 基因功能,基因之间 相互关系 和 调控机制 为主要内容的学科。
目前人类基因组计划已测定了人类基因组序列中 85%
以上的核苷酸序列,将计划完成 全序列测定 的时间从 2005
年提前到 2003年。 2001年 4月 26日,公布了人类基因序列框架草图。
三、后基因组学 (post-genomics ),
自从 1996年酵母菌基因组全序列测定 以来,全世界已有
1000多个实验室,5000多名科学家从事酵母菌后基因组学的研究,共发表论文 7000多篇,鉴定 1060个新基因的功能,但仍然还有约 1600个阅读框架的功能不清楚。
后基因组学主要技术:
DNA微列阵技术;
蛋白质组学;
酵母菌双杂交系统;
生物信息学等技术。
1,DNA微列阵 (DNA microarrays),
是利用 DNA芯片技术?同时进行大量分子杂交,分析比较不同组织或器官的基因表达水平,筛选突变基因,从 核酸水平 分析基因表达模式。
2,蛋白质组学 (proteomics ),
是 从蛋白质水平来研究基因组的基因表达?
分析基因组的蛋白质类型、数量、空间结构变异以及相互作用的机制。
蛋白质组学比基因组学更为复杂,
∵ 真核生物的基因表达受转录因子控制,转录因子需与启动子区域的 DNA结合?并激活 RNA聚合酶转录。
转录因子具有 DNA结合 及 激活转录 两功能,分别由不同区域完成,而且将这两部分 分割成两个片段 后仍由互作?
能装配成一个完全有功能的转录因子。
基于这一特点,设计出酵母双杂交系统。
是利用酵母菌同一个细胞中共同表达不同蛋白质,以鉴定蛋白质之间互作 的一种分析方法。
3,酵母菌双杂交系统 (two hybrid-systems),
4,生物信息学 (bioinformatics ),
是一种用 计算机 贮存原始资料,分析生物信息,将
DNA芯片以及蛋白质双向电泳结果转变成为可读的遗传学信息的学科。
生物信息学是 现代生物技术与计算机科学的结合,收集、加工和分析生物资料和信息。
生物信息学 是在未来生命科学中起关键作用的学科之一。
应用生物信息学 可以将来不同的基因组理论和应用综合并标准化,利用大量的生物信息资料来 了解 遗传网络系统,信号传递 及 相互关系,计算机还可进行一些 生物模拟 研究。
∴ 利用生物信息学能够 分析 从微生物、植物以及人类基因组序列测定产生的大量资料?阐明 遗传信息。
1.遗传工程:
细胞工程中核移植与体细胞克隆技术。
本章小结载体条件与限制性内切酶;
目的基因获取与体外重组;
转基因技术及其应用;
2.基因组学:
后基因组学,DNA芯片技术、蛋白质组学、生物信息学等。
基因图谱构建,遗传图谱和物理图谱的构建;
基因图谱应用,基因定位、比较基因组学,MAS、基因克隆;