第一章 绪 论
随着医学科学的发展,医学家们都已经认识到医学实践中所遇到的一些问题(例如某些疾病的病因、发病机制、病变过程、预防和诊治等)需要用遗传学的理论和方法才能得以解决。比如为什么有高血压家族史的人更易患高血压病?为什么同一药物对患有同一疾病的不同患者的疗效不同(有人显效、有人无效、有人表现出严重的副作用)?第一胎生了一个有先天缺陷的婴儿,第二胎也为先天缺陷患儿的(再发)危险有多大,是否可能出生健康的第二胎?唐氏综合征(即Down综合征或先天愚型,一种由于染色体异常而引起的痴呆症)是如何发生的,它在新生儿中出现的机会为什么随母亲年龄的增大而增加?这类疾病能不能得到有效的根治?怎样才能预防这类疾病的发生而达到健康生殖(healthy birth)的目的?……等等。随着人口的不断增加,不少国家都采取了控制人口的措施,使人们在少生的同时更渴望得到健康生殖;另一方面,由于人们对疾病发生、发展本质的认识有了进一步提高,因此认为绝大多数疾病的发生、发展和转归都是内在(遗传)的和外在(环境)的因素综合作用的结果;同时在疾病的发展过程中,机体与致病因素交互作用,或者致病因素对机体细胞产生损害作用,或者机体细胞对致病因素产生适应性反应(在多数情况下,这一反应是保护机体细胞并去有害的致病因素),这些交互作用的结果决定着机体细胞未来的发展方向,或恢复细胞的正常生理功能,或细胞产生异常损害,继而发生组织、器官的损害,导致疾病的形成,并在临床上表现为一定的特征。所以,与环境一样,遗传已成为现代医学中的重要领域,临床医生在临床工作中正在遇到越来越多的遗传学问题,与此同时,医学与遗传学的结合即形成了医学遗传学(medical genetics)这一介于基础与临床之间的桥梁学科。
第一节 医学遗传学的任务和范畴
在传统的观念上,遗传因素与环境因素在疾病发生、发展中的交互作用考虑得较少,所以比较局限。一般把遗传因素作为惟一或主要病因的疾病称为遗传病(genetic disease);相应地,医学遗传学就是用人类遗传学(human genetics)的理论和方法来研究这些“遗传病”从亲代传至子代的特点和规律、起源和发生、病理机制、病变过程及其与临床关系(包括诊断、治疗和预防)的一门综合性学科。也有人将侧重于遗传病的预防、诊断和治疗等内容划归临床遗传学(clinical genetics)或遗传医学(genetic medicine)的范畴,而医学遗传学则侧重于遗传病的病因学、病理生理学的研究。然而,现代医学中的医学遗传学概念比传统医学中的医学遗传学概念有一定的扩充,它首先认为疾病是一个涉及内在(遗传)因素与外在(环境)因素的复杂事件,因此现代医学遗传学更侧重于从综合的角度比较全面地探讨和分析遗传因素在疾病发生、发展、转归过程中的作用。
前已述及,医学遗传学是以人类遗传学为基础的,它们都是以人为研究对象,这是它们的共同点。不同的是,人类遗传学主要从人种和人类发展史的角度来已研究人的遗传性状,例如人体形态的测量以及人种的特征,同时广泛地研究形态结构、生理功能上的变异,例如毛发的颜色、耳的形状等。在临床上,这些变异并不干扰或破坏正常的生命活动,其临床意义不大。而医学遗传学往往是从医学角度来研究人类疾病与遗传的关系。因此,医学遗传学也可以说是一门由遗传病这一纽带把遗传学和医学结合起来的边缘学科。
Genetic Diseases to Medicine
Queried at the turn of the millennium about the relevance of genetic diseases to medicine, a primary care physician might well have replied “not in my practice.” After all, for most of its history, medical genetics has been devoted largely to the study of relatively rare single-gene or chromosomal disorders. Patients with these disorders were mostly cared for in tertiary care medical centers by specialists. But all that is changing genetics is invading the mainstream of medical practice.
第二节 医学遗传学发展简史
Mendel于1865年发表的《植物杂交实验》一文揭示了生物遗传性状的分离和自由组合规律,这是科学意义上的遗传学诞生的标志,但Mendel这项工作的重要价值直到1900年才被发现;随即,该学说就被应用于解释一些人类疾病的遗传现象。Garrod(1901)描述了4个黑尿症家系,首次提出了先天性代谢病的概念,并认为这种疾病的性状属于隐性遗传性状;Farabee(1903)指出短指(趾)为显性遗传性状;Hardy和Weinberg(1908)研究人群中基因频率的变化,提出遗传平衡定律,奠定了群体遗传学的基础;Nilsson(1909)研究数量性状的遗传,用多对基因的加性效应和环境因素的共同作用阐述数量性状的遗传规律。这个阶段,遗传学的理论研究得到充分的发展,但是限于当时的技术水平,这些理论的实验验证及遗传物质的微观研究还无法深入开展。
20世纪的20年代到40年代,Griffith和Avery用肺炎双球菌转化实验证明了DNA是遗传物质,1953年Watson和Crick研究了DNA的分子结构,提出了DNA的双螺旋模型,使人们认识了遗传物质的化学本质。随着生物化学实验技术的发展,对一些先天性代谢缺陷疾病的生化机制逐步阐明,先后发现糖原贮积症Ⅰ型是由于缺乏葡萄糖-6-磷酸酶,苯丙酮尿症是由于缺乏苯丙氨酸羟化酶,并提出了一种基因一种酶的学说。
1952年,由于低渗制片技术的建立(徐道觉等)和使用秋水仙碱获得了更多中期细胞分裂像(蒋有兴等)后,才证实人体细胞染色数目为46。标志着细胞遗传学的建立,并相继发现Down综合征为21三体(Lejeune等)、Klinefelter综合征为47,XXY(Jacob和Strong)等。在染色体显带技术出现后,更多的染色体畸变引起的疾病不断被发现和报道。
20世纪70年代,限制性内切酶的使用使研究者首次能够对DNA进行可控的操作。1978年Y W Kan(简悦威)运用这两种技术实现了对镰状细胞贫血的产前基因诊断。80年代出现的聚合酶链反应(PCR)技术能在体外实现DNA分子的快速扩增,从而使某些疾病的DNA检测成为临床的常规工作。
真正使医学遗传学发生革命性变化的是九十年代开始的人类基因组计划。人类基因组计划的研究目标是从整体上阐明人类遗传信息的组成和表达,包括遗传图绘制、物理图构建、测序、转录图绘制和基因鉴定等方面的工作,为人类遗传多样性的研究提供基本数据,揭示上万种人类单基因异常(有临床意义的约计5000种)和上百种严重危害人类健康的多基因病(例如心血管疾病、糖尿病、恶性肿瘤、自身免疫性疾病等)的致病基因或疾病易感基因,建立对各种基因病新的诊治方法,从而推动整个生命科学和医学领域发展。
第三节 遗传病概述
按经典的概念,遗传病或遗传性疾病是其发生需要有一定的遗传基础,通过这种遗传基础,按一定的方式传于后代发育形成的疾病。因此,遗传病的传递并非是现成的疾病,而是遗传病的发病基础。而在现代医学中,遗传病的概念有所扩大,遗传因素不仅仅是一些疾病的病因,也与环境因素一起在疾病的发生、发展及转归中起关键性作用。因此在了解医学遗传学时,既要把握经典的遗传病概念,也要对遗传病的新进展有所认识。但在本教材中,主要以经典概念为线索展开讨论的。
一、遗传病的特点
作为一种以遗传因素为主要发病因素的遗传病,在临床上有许多特点。
(一)遗传病的传播方式
一般而言,遗传病与传染性疾病、营养性疾病不同,它不延伸至无亲缘关系的个体。就是说,如果某些疾病是由于环境因素致病,在群体中应该按“水平方式”出现;如果是遗传性的,一般则以“垂直方式”出现,不延伸至无亲缘关系的个体,这在显性遗传方式的病例中特别突出。
(二)遗传病的数量分布
患者在亲祖代和子孙中是以一定数量比例出现的,即患者与正常成员间有一定的数量关系,通过特定的数量关系,可以了解疾病的遗传特点和发病规律,并预期再发风险等。
(三)遗传病的先天性
遗传病往往有先天性特点。所谓先天性是生来就有的特性,如白化病是一种常染色体隐性遗传病,婴儿刚出生时就表现有“白化”症状。但不是所有的遗传病都是先天性的,如Huntington舞蹈病是一种典型的常染色体显性遗传病,但它往往在35岁以后才发病。反过来,先天性疾病也有两种可能性,即有些先天性疾病是遗传性的,如白化病;有些则是获得性的,如妇女妊娠时因风疹病毒感染,致胎儿患有先天性心脏病,出生时虽然具有心脏病,但传统概念来说它是不遗传的。
(四)遗传病的家族性
遗传病往往有家族性等特点。所谓家族性是疾病的发生所具有的家族聚集性。遗传病常常表现为家族性,如上述的Huntington舞蹈病常表现为亲代与子代间代代相传;但不是所有的遗传病都表现为家族性,如白化病在家系中很可能仅仅是偶发的,患儿父母亲均为正常。反过来,家族性疾病可能是遗传的,如Huntington舞蹈病;但不是所有的家族性疾病都是遗传的。例如有一种夜盲症(即当光线比较弱时,视力极度低下的一种疾病)是由于饮食中长期缺乏维生素A引起的。如果同一家庭饮食中长期缺乏维生素A,则这个家庭中的若干成员就有可能出现夜盲症。这一类家族性疾病是由共同环境条件的影响,而不是出自遗传原因,如果在饮食中补充足够的维生素A后,全家病员的病情都可以得到改善。所以说,由于维生素A缺乏所引起的夜盲症,尽管表现有家族性,但它不是遗传病。
(五)遗传病的传染性
一般的观点认为,遗传病是没有传染性的。因此在传播方式上,它是垂直传递,而不是水平传递的。但在目前已知的疾病中,人类朊蛋白病(human prion diseases)则是一种既遗传又具传染性的疾病。朊蛋白(prion protein,PrP)是一种功能尚不完全明确的蛋白质。目前认为PrP基因突变会导致PrP的错误折叠或通过使其他蛋白质的错误折叠进而引起脑组织的海绵状病变,最终导致脑功能紊乱,称为蛋白折叠病;而错误折叠的PrP可以通过某些传播方式使正常人细胞中的正常蛋白质也发生错误折叠并致病。
总之,对于医学工作者来说,掌握一定的医学遗传学知识,将有助于工作中正确认识人类疾病病,以便采取相应的诊断、治疗和预防措施。
二、人类遗传病的分类
人类遗传病的种类繁多。据统计,目前每年新发现的遗传性综合征有100种左右。面对种类如此众多的遗传病,过去一是按人体系统分类,如神经系统遗传病、血液系统遗传病、生殖系统遗传病、心血管系统遗传病、泌尿系统遗传病、内分泌系统遗传病等等;二是按照遗传发式进行分类,即:
显性遗传病
常染色体病
隐性遗传病
单基因病
显性遗传病
基因病 性染色体病
隐性遗传病
多基因病
遗传病 数目异常遗传病
常染色体病
结构畸变遗传病
染色体病 数目异常遗传病
X染色体病
结构畸变遗传病
性染色体病 数目异常遗传病
Y染色体病
结构畸变遗传病
现代医学遗传学将人类遗传病划分为5类。
(一)单基因病
单基因病由单基因突变所致。这种突变可发生于两条染色体中的一条,由此所引起的疾病呈常染色体(或性染色体)显性遗传;这种突变也可同时存在于两条染色体上,由此所引起的疾病呈常染色体(或性染色体)隐性遗传。这类单基因病较少见,发生率较高时也仅为1/500,但由于其遗传性,因而危害很大。
(二)多基因病
多基因病是有一定家族史、但没有单基因性状遗传中所见到的系谱特征的一类疾病,如先天性畸形及若干人类常见病(高血压、动脉粥样硬化、糖尿病、哮喘、自身免疫性疾病、老年痴呆、癫痫、精神分裂症、类风湿关节炎、智能发育障碍等)。环境因素在这类疾病的发生中起不同程度的作用。
(三)染色体病
染色体病是染色体结构或数目异常引起的一类疾病。从本质上说,这类疾病涉及一个或多个基因结构或数量的变化,因此其对个体的危害往往大于单基因病和多基因病,其中最常见的染色体异常为Down综合征。
(四)体细胞遗传病
单基因病、多基因病和染色体病的遗传异常发生在人体所有细胞包括生殖细胞(精子和卵子)的DNA中,并能传递给下一代,而体细胞遗传病(somatic cell genetic disorder)只在特异的体细胞中发生,体细胞基因突变是此类疾病发生的基础。这类疾病包括恶性肿瘤、白血病、自身免疫缺陷病以及衰老等。在经典的遗传病中,并不包括这一类疾病。
(五)线粒体遗传病
线粒体是细胞内的一个重要细胞器,是除细胞核之外惟一含有DNA的细胞器,具有自己的蛋白质翻译系统和遗传密码。线粒体遗传病就是由线粒体DNA缺陷引起的疾病,包括Leber遗传性视神经病等。
表1-1列举了一些遗传病及其遗传方式和发生率。
表1-1 常见遗传病的遗传方式及发生率
疾病(OMIM #)
遗传方式
发生率
单基因病
腺苷脱氨酶缺乏症(102700)
AR
少见
α-1抗胰蛋白酶缺乏症(107400)
AR
1/3000~1/20000
囊性纤维变性(219700)
AR
1/2000;亚洲人极罕见
Dunchenne肌营养不良(310200)
XR
1/3000~1/3500
家族性高胆固醇血症(143890)
AD
1/500
脆性X综合征(309550)
XL
男性:1/500;女性:1/2000~1/3000
葡糖-6-磷酸酶缺乏症(305900)
XR
男性:1/4~1/20
血友病A(306700)
XR
男性;1/10000
Huntington舞蹈病(143100)
AD
4~8/100000
强直性肌营养不良症(160900)
AD
1/10000
神经纤维瘤I型(162200)
AD
1/3000~1/5000
成骨不全(166200)
AD
1/15000
苯丙酮尿症(261600)
AR
1/5000
视网膜母细胞瘤(180200)
AD
1/14000
镰状细胞贫血(603903)
AR
部分种族:1/400
地中海贫血(140100)
AR
常见
Wilms瘤(194070)
AD
1/10000
Tay-Sachs病(272800)
AR
1/3000
染色体病
Down综合征(190685)
47,+21
1/800
18三体综合征
47,+18
1/8000
13三体综合征
47,+13
1/25000
Klinefelter综合征
47,XXY
男性:1/1000
Turner综合征
45,X
女性1/5000
XXX综合征
47,XXX
女性:1/1000
XYY综合征
47,XYY
男性:1/1000
Prader-Willi综合征(176270)
1/10000~1/25000
多基因遗传病
唇裂(119530)
1/250~1/600
先天性心脏病
1/125~1/250
神经管缺陷(601634)
1/100~1/500
糖尿病(222100;125853)
成人:1/10~1/20
冠状动脉粥样硬化病(209010)
特定人群:1/15
体细胞遗传病
肿瘤
总:1/3
线粒体疾病
Leber遗传性视神经病(535000)
细胞质遗传
少见
注:AR为常染色体隐性遗传;AD为常染色体显性遗传;XL为X连锁遗传;XR为X连锁隐性遗传
三、在线《人类孟德尔遗传》
“在线《人类孟德尔遗传》(OMIM)”为“Online Mendelian Inheritance in Man”的简称,意即“在线《人类孟德尔遗传》”或“网上《人类孟德尔遗传》”。由美国Johns Hopkins大学医学院Victor A McKusick教授主编的《人类孟德尔遗传》(Mendelian Inheritance in Man:Catologs of Human Genes and Genetic Disorders,简称MIM)一书,一直是医学遗传学最权威的百科全书和数据库,被誉为医学遗传学界的“圣经”。MIM包括所有已知的遗传病、遗传决定的性状及其基因,除了简略描述各种疾病的临床特征、诊断、鉴别诊断、治疗与预防外,还提供已知有关致病基因的连锁关系、染色体定位、组成结构和功能、动物模型等资料,并附有经缜密筛选的相关参考文献。MIM制定的各种遗传病、性状、基因的编号,简称MIM号,为全世界所公认。有关疾病的报道必须冠以MIM号,以明确所讨论的是哪一种遗传病。MIM自1966年初版以来,随着医学遗传学的迅猛发展,MIM内容急剧扩增,至1998年已出至第12版。印刷版本的MIM,尽管不断增厚,但在科学研究已进入数字化年代的当今,显然已很难跟上医学遗传学发展的步伐,有“力不从心”感。鉴此,联机形式的“在线人类孟德尔遗传”于1987年应运而生,并且免费供全世界科学家浏览和下载。OMIM的网址是:http://www.ncbi.nlm.nih.gov/omim。
截止2003年12月26日的统计数据,OMIM总条目数为15040个,与人类疾病或性状相关的基因座为11189个,仅有表型描述的为1458个,其它条目2393个。其中,常染色体遗传条目14099个,X连锁遗传条目833个,Y连锁遗传条目48个,线粒体遗传条目60个。已经定位的人类基因数目(不包括EST、拟基因、基因标志、cDNA)为8848个(其中1号染色体841;2号550;3号471;4号340;5号425;6号544;7号403;8号316;9号321;10号298;11号554;12号453;13号155;14号267;15号254;16号329;17号511;18号136;19号582;20号203;21号117;22号223;X染色体520;Y染色体35)。
四、疾病的发生与遗传因素和环境因素的关系
遗传(heredity)是生物体的基本生命现象,表现为性状在亲代与子代之间的相似性和连续性。人类的一切正常或异常的性状综合起来看都是遗传与环境共同作用的结果,但它们在每一具体性状的表现上可能不尽相同。
(一)完全由遗传因素决定发病
但是,这类疾病的发生并非与环境因素无关,只是看不出什么特定的环境因素是发病所必需的,例如单基因遗传病中的先天性成骨不全症、白化病、血友病A以及一些染色体病。
(二)基本上由遗传决定,但需要环境中一定诱因的作用
例如单基因遗传病中的苯丙酮尿症,早期人们只知道它与遗传有关,现在知道吃了含苯丙氨酸量多的食物才诱发本病;葡萄糖-6-磷酸脱氢酶缺乏症(俗称蚕豆病)除有遗传基础外,吃了蚕豆或服用氧化性药物伯氨喹啉等以后才诱发溶血性贫血。
(三)遗传因素和环境因素对发病都有作用,在不同的疾病中,其遗传度各不相同
也就是说,遗传因素对发病作用的大小是不同的。例如在唇裂、腭裂、先天性幽门狭窄等畸形中,遗传度都在70%以上,说明遗传因素对这些疾病的发生较为重要,但环境因素也是不可缺少的。精神发育障碍、精神分裂症等疾病也是如此。另一些疾病,例如在先天性心脏病、十二指肠溃疡、某些糖尿病等的发生中,环境因素的作用比较重要,而遗传因素的作用较小,遗传度不足40%,但是就其发病来说,也必须有这个遗传基础。还有一些疾病如脊柱裂、无脑儿、高血压、冠心病等的发病,遗传因素和环境因素等相当重要,遗传度约50%~60%左右。
上述这类疾病过去在临床上常常说有一定的遗传因素(体质或素质),近年来的研究表明,它们所具有的就是多基因(易感基因)决定的遗传基础,这一类疾病(多基因病)具有常见性、多发性的特点,是目前医学研究的重点。
(四)发病完全取决于环境因素,与遗传基本上无关
例如烧伤、烫伤等外伤的发生与遗传因素无关。有人认为,这类疾病损伤的修复与个体的遗传类型有关。
五、遗传病在医学实践中的一些问题
(一)医生如何确定患者所患疾病是否有遗传性
遗传病患者(与非遗传病患者一样)在向医师主诉自己的病症时,只能说明其某些感觉上异常,而不能告诉医生自己什么基因有什么异常。因此,需要医师正确地区分患者所患疾病是不是一种遗传病。但这并不是一件轻而易举的事情,它不仅需要医师具有丰富的临床经验、全面的遗传学知识,还需要足够的实验室技术(包括分子诊断)来辅助诊断。近年来,计算机软件被开发用于遗传病的诊断,为医师确定患者所患疾病是否具有遗传性提供了有力的手段,从而使遗传病患者及亲属能得到有效的医学处理。
(二)再发风险率
再发风险率(recurrence risk)是遗传病在临床医学中常遇到的问题之一。所谓再发风险率,是病人所患的遗传性疾病在家系亲属中再发生的风险率。影响再发风险率的因素较多,因此人们很难对遗传病的再发风险率制订出一个标准。例如,一方面,Huntington舞蹈病是一种常染色体显性遗传病,按理论推测,患者子女的再发风险率为50%。但本病的发病年龄多在35岁以后,随着子女年龄的增长,再发风险率也逐渐下降,通过建立年龄与再发风险率的发病曲线,可以得到不同年龄个体的再发风险率。另一方面,任何一种遗传病都有一个群体风险率的基线(baseline),即任何一次妊娠所生子女其群体风险率有些是根据疾病的遗传方式决定的,有些是基于经验概率得到的(表1-2)。
表1-2 群体中某些疾病发生的风险率
疾 病
风 险 率
出生时即表现出先天性异常
1:30
严重的身体或智能残疾
1:50
自发流产
1:8
死胎
1:125
围生期死亡
1:150
出生后一周到周岁以内死亡
1:200
夫妇不育
1:6~10
(三)遗传性疾病的群体负荷
这里所说的负荷是指遗传病在群体中的严重程度,通常用发生率来表示。发生率越高,群体中的遗传有害性越高,人类需要的对应措施越多,也可以说是负荷也越大。表1-3所列是几类遗传病的群体发生率。
表1-3 遗传性疾病的群体发生率
疾 病
发生率(%)
疾 病
发 生 率(%)
单基因缺陷
多基因遗传病
常染色体显性遗传病
0.14
先天性疾病
2.3
常染色体隐性遗传病
0.17
其他疾病
2.4
X连锁遗传病
0.05
小计
4.7
小计
0.36
尚未归类的遗传病
0.12
染色体缺陷
0.19
总计
5.37
(四)遗传病与医学伦理
医学伦理学的基本原理同样适用于医学遗传学中。但遗传病有其自身的特征,即遗传性,因此,对一些问题需要特别注意。
1.遗传性疾病的产前诊断问题。这包括:①产前诊断技术上的安全性;②产前诊断实施后对患病胎儿的医学措施的“合法性”、“合理性”、“可靠性”、“安全性”等等。
2.遗传病的症状前诊断问题。这涉及:①是否有有效的医学措施使症状前患者免受“未来”疾病的困扰;②个人隐私问题。
3.基因诊断和基因治疗问题。这包括:①基因诊断、基因治疗在技术上的安全性问题;②诊断及治疗措施的“合法性”、“合理性”等问题;③基因治疗措施对人类基因组的安全控制问题等等。
宗教、伦理、道德、法律也都是遗传病临床实践中需要重视的问题。遗传病患者的基因组应属个人隐私,其中含有什么致病基因或易感基因,若用现代方法查出后结果被泄露出去,如果没有相应的法律加以保护,被检对象就可能在就业、恋爱、婚姻、保险等方面受到歧视。近年来,整体动物克隆技术的发展使得生物技术的伦理问题更趋复杂化。这些都需要生物医学界和法律界共同商讨、制订对策,并取得全社会的理解和支持。
第四节 遗传病的研究策略
医学遗传学是以遗传病为研究对象,那么对遗传病研究的策略也就要围绕遗传病的病理、诊断、治疗和预防等内容来进行。就目前的研究水平和技术手段而言,致病基因的定位与克隆是首要的任务,因为只有真正从基因组中彻底分离出致病基因,才能从根本上研究遗传病的病理基础,并找出相应的预防和治疗对策。随着对遗传病研究的不断深入,人们发现不同遗传病的遗传方式、发病率都有着巨大的差别,因此在致病基因的分离方法与策略上也要有所区别。对临床上已经发现并明确的遗传病,首先要进行遗传规律的研究,是常染色体遗传或性染色体遗传,单基因遗传还是多基因遗传,显性遗传或隐性遗传。然后根据此遗传病是否有可检测到的生化指标或蛋白质异常,或者这个遗传病是否总是和某一遗传标记共分离(co-segregation)等资料,以决定对致病基因进行定位和克隆的策略。
另外,不同遗传病的诊断和治疗也应根据各自特点决定研究方法和研究重点,因此我们对单基因病、多基因病、染色体病的研究特点分别做一简要阐述。
一、单基因遗传病的研究
单基因遗传病是最先被认识和研究的遗传病,1901年,Garrod就研究了隐性遗传的黑尿症,认为这种疾病是由体内的某种酶的缺陷造成的,并提出了先天性代谢病的概念,因此,早期对遗传病的研究首先集中在由遗传损伤而引起的生化功能如酶或蛋白质缺陷上,然后通过蛋白质的信息设计出核酸探针,筛选特定的文库从而获得相应遗传病的致病基因,这就是所谓的功能克隆(functional cloning)。典型的例子是镰状细胞贫血病的致病基因β-珠蛋白基因的分离和确定。然而,迄今为止发现的六千多种单基因病绝大多数基因产物不明,这种策略在大多数情况下无法奏效,因此位置克隆(positional cloning)的方法应运而生,该方法首先进行致病基因的染色体定位,然后寻找相应染色体位置上的大片段基因组克隆,在其中分析可能存在的功能基因,并在患者中进行侯选基因的突变分析,最后才对确定的侯选基因进行功能研究,早先也称该方法为逆向遗传学(reverse genetics)。随着人类基因组研究的日新月异,多态遗传标记的覆盖已经越来越密集,第三代多态遗传标记单核苷酸多态性(single nucleotide polymorphism,SNP)的平均密度可达1000bp就有一个,为遗传病致病基因的克隆提供了极大的方便。人类基因组物理图谱的完成使得大片段基因组克隆重叠群的获得不成问题,甚至可以获取这些大片段DNA的全序列信息。因此基因的定位成为致病基因克隆的关键,在缺乏任何遗传病相关DNA序列信息的情况下,应用最多的是定位方法是连锁分析。基因定位的连锁分析是通过检测遗传性状(致病基因位点)在家系传递过程中与多态位标发生重组的频率来确定该基因与位标之间的距离。一般所指的连锁分析为优势对数记分法(lod score),这是根据最大似然性理论计算出以某一重组率连锁的可能性与不连锁可能性比值的对数值,Lod>1支持连锁,Lod>3肯定连锁,运用位置克隆策略克隆的人类疾病基因已有很多成功的范例,如慢性肉芽肿基因、Huntington舞蹈病基因,肝豆状核变性基因等。
Linkage Analysis: A Route to Discovering Genetic Defects
In the 1980s, linkage emerged as a route to discovering genetic defects, spurring the rise of genomics and making gene-based approaches available to previously phenotype-orientated researchers. In the post-genomics era, genetics is fundamental to understanding disease at all stages of the pathogenic process.
二、多基因遗传病的研究
单基因疾病虽然种类远较多基因疾病为多,但是由于多基因疾病的发病率大多较高,因此其危害更加严重。如很多心脑血管疾病、老年性痴呆、糖尿病、哮喘等常见病、多发病都有多基因遗传基础。多基因疾病虽具有一定程度的家族聚集倾向,但并不表现出典型的孟德尔式遗传,此类疾病由多个基因和外源因素共同作用而形成。因此多基因疾病相关基因的定位相当困难。原则上,Lod连锁分析也可以应用,但是其效能很低,通常要求有主效基因,并要有明确的遗传方式,或者能够根据可靠指标将复杂性状进行分割再做连锁分析。目前,一种不依赖于遗传模式的非参数连锁分析法被认为是多基因疾病的理想分析法,即患病同胞对法(affected sib-pair,ASP),ASP法的研究对象是各家系中的患病同胞对,并寻找共同出现概率超过1/4的遗传标志,则该标志本身或其周围存在疾病相关基因。由于ASP法需要大量的患病同胞对,取样较困难,又将该方法的分析对象扩展到整个家系的所有成员而演化出患病家系成员法(affected pedigree member,APM),解决了家系资料来源不足的问题,但是APM法的分析效能低于ASP法。多基因疾病相关基因定位的另一方法是建立于群体水平上,即在病例和对照群体中寻找某一遗传标记与疾病表型的关联,这种关联一般表明遗传标记即易感基因或与易感基因存在连锁不平衡,当然,如果样本的选择出现偏倚,就会出现假性关联,所以当初步分析发现可疑相关后,可用传递不平衡检验法(transmission disequilibrium test,TDT)加以验证,这是一种家系内关联分析,可有效地消除由于人群分层偏倚造成的假性关联。应用上述各种方法,乳腺癌相关基因BRCA1、BRCA2和胰岛素依赖型糖尿病相关基因等相继被克隆定位,在原发性高血压、老年性痴呆等研究领域也取得重要进展。
由于多基因疾病致病因素的复杂性,易感基因的克隆只是揭示疾病发生机制的开端,其致病机制要通过基因之间及基因与环境之间相互作用的网络结构模式来研究。从目前的研究水平来看,多基因疾病患儿的风险预测及产前诊断还相当困难,但随着一些高通量检测技术如基因芯片、蛋白质芯片的应用,易感基因的功能及作用方式将被逐步阐明,可望将多基因疾病的基因诊断用于临床。另外,多基因疾病高风险人群的监测也是一个重要环节,避免使该类人群暴露于危险因素可有效减低发病率。对于一些常见的高发性多基因遗传病,还必须大力提高治疗水平,基因水平的治疗目前还缺乏可靠的理论基础和技术手段,但是随着易感基因的功能及作用方式的阐明,针对性的治疗药物的开发将会达到一个前所未有的高度。
由于绝大多数多基因疾病相当复杂,为了更客观地研究它,许多科学家建立了或试图建立更科学的多基因疾病研究模型,以综合的观点,兼顾环境和遗传两个方面,研究多基因疾病的决定因素。这里简要介绍数量性状位点分析和生物统计模型拟合。
(一)数量性状位点分析
尽管早在20世纪初就已经可以利用遗传标记检测出数量性状位点(quantitative trait loci,QTL),但由于可利用的遗传标记太少,所以上个世纪80年代以前,对数量性状的遗传分析只是停留在理论上。20世纪80年代起,RFLP、STR及SNP等多态性标记的发现,特别是人类基因组计划的推动,使行为的QTL的定位及基因克隆开始成为可望也可及的现实。通过这种遗传定位和基因克隆,可以将一个复杂的多基因系统分解成一个个单基因,使人们能够像分析质量性状那样分析数量性状,这不仅大大加深人们对数量性状基础的认识,也将大大增强人们对数量性状的操纵能力。
(二)生物统计模型拟合
另一个分析多基因疾病中遗传与环境复杂关系的方法是生物统计模型拟合(biometric model fitting)。这一技术主要是由一些数量遗传学家于上世纪七十年代基于通径分析(path analysis)和结构等式模型(structural equation modeling)等统计方法建立起来的。生物统计模型拟合在分析家系或双生子的相关与回归具有许多优点。来自不同家系关系的资料可以结合在一个模型内进行遗传、环境以及遗传和环境交互作用的分析,从而为复杂的行为研究带来变革。
三、染色体病的研究
染色体病是染色体的数目或结构异常而造成的具有一系列临床症状的综合征。由于染色体病往往涉及数十乃至上百个基因的增减或位置变化,故常表现多发的先天性异常或畸形,这就造成了染色体病治疗上的极大困难,因而防止患儿的出生被提到首要位置,这就需要准确的产前诊断技术。对于染色体病的产前诊断而言,最常用的是通过羊水、绒毛和胎儿血检查胎儿染色体有无异常。从理论上讲,整个孕期可以检查胎儿染色体,如胚胎着床前诊断技术对受精卵即可进行染色体检查。但由于安全、技术、实用及经济上的原因,目前仍以羊水染色体检查为主。
近年来对一些发病率较高的染色体疾病如Down综合征的研究进一步深入,开始具体探讨染色体不分离过程中所涉及的生物分子、生理途径及环境诱因,并籍此找出可靠的指标对有关人群出生患儿的风险进行预测和评估。
医学遗传学是近年来发展很快的一门学科,随着人类基因组图谱绘制的完成以及功能基因组计划的全面展开,所有基因都将被准确定位,基因在细胞水平的功能和整体水平的效应也可望逐步得到阐明,这就使得遗传病的病理机制研究更加方便快捷。不过遗传病研究的目的是要降低人群中的发病率,因此最重要的一点就是要做好预防工作,以防为主。遗传病的预防分三个阶段,一级预防是孕前预防,二级预防是产前预防,三级预防是新生儿筛查。目前世界各国大多建立了区域性的遗传医学中心或医学中心从事这方面的工作,以减少遗传病患儿的出生给家庭、社会造成的巨大负荷,并从总体上提高整个国家的人口素质。
(左 伋)