理论教育 DNA溶于盐水:单倍群编码

DNA溶于盐水:单倍群编码

时间:2023-11-23 理论教育 版权反馈
【摘要】:提取DNA很简单,因为DNA溶于盐水。如果一批样本中有十几个或更多的变化被同时确认,这些样本就属于一个特定的单倍群。每一个人都可以归纳进某一个单倍群。单倍群是十几个或更多的变异同时遗传的。斯坦福大学团队发现的定义单倍群的标记突变通常用M表示,例如,M9或M60表示第9个和第60个发现的突变。正是这些基因标记,使得我们知道了这个单倍群(氏族)与另一个单倍群(氏族)之间的关系。

DNA溶于盐水:单倍群编码

法国大革命前夕,经济历史学家大卫·兰德斯(David Landes)的研究证实,当时法国农民的状况与两千年前的罗马帝国时代差别不大,亦即与公元前59年恺撒征服高卢时代差别不大,耕作,缴税,生活艰难,卫生保健和医疗条件有限,身高和预期寿命等也与罗马帝国时代差别不大。法国农民活动范围也是区域性的。

人口学家(Demographers)主要研究出生、婚姻和死亡等信息,根据法国教会的记录数据,18世纪的法国,配偶的出生地点之间的距离只有几千米,说明当时法国农民很少旅行。直到19—20世纪的产业革命之后才出现变化,所以产业革命又被称为机动力革命(mobility revolution)。

配偶出生地点的平均距离在几个世纪里的增长

法国大革命之前,一大半法国人不说法语,而是说各地的语言。也就是说,一大半法国臣民的语言与路易十六和他的朝廷在巴黎说的法语完全不同。缺乏机动力的时代,语言也是相对封闭的。几百年甚至几千年里,人们互不交流,经过若干代之后,地理惰性形成互不相同的语言。在这种长期停滞的社会里,人们的婚姻对象往往局限在自己村庄的几百个人里,也许就是自己的邻居……最后,不知不觉中,一个区域内的亲属关系越来越复杂,人们互相之间形成盘根错节的亲属网络关系,很多人拥有相同的遗传形态。

欧洲的王室家族的近亲婚姻,最典型的例子是哈布斯堡王朝(House of Habsburg)。这个王朝是欧洲历史上最有权势的王朝,起源于奥地利、匈牙利,他们通过婚姻关系扩大政治联盟。哈布斯堡王朝的鼎盛时代几乎联姻到了欧洲的每一个王室,使得16—18世纪的欧洲王室之间的血缘关系极其接近,遗传学效果使他们几乎成为一个“小村庄”。这个王朝不仅一代又一代地遗传财富和权势,也遗传基因标记和各种生理缺陷。按照遗传学意义,这个王朝最后变为同系交配或同族交配(endogamous),越来越差的王室后代正是哈布斯堡王朝最后土崩瓦解的重要原因之一。

性的遗传是为了优秀的后代。研究遗传的道理,一点也不复杂。性染色体Y上的变化很少,因为Y染色体始终是“孤独”的,不参与卵子与精子的重组:要么Y被丢弃,X与X结合成为一个女孩胚胎;要么Y与X结合,成为一个男孩胚胎。所以Y染色体成为我们追寻先祖的不可多得的机会。

提取DNA很简单,因为DNA溶于盐水。首先把样本(细胞)加入盐水,用离心机把其他蛋白质细胞膜等分离出来,脱水干燥之后的DNA是晶体结构。然后加入100%的酒精,再用离心机分离,重复多次以后,试管底部只剩下DNA。

第二步则比较难办。基因组约30亿个核苷酸,应该阅读哪一部分?基因组的测序需要大型实验室和巨型电脑,我们只能对比分析其中很小一部分,即使在这个微小的部分,每个人99.9%以上的基因序列都是相同的,每一个人都和其他人的差别不到1/1000,只有科学家才知道在哪些地方寻找和对比差异。这些差异的发生概率也很低,也就是说,如果你和某一个人携带同一个基因标记,你肯定在过去的某一时间点与这个人拥有同一个祖先。

遗传学家的办法是隔绝某一区位,再放大这个区位(多次复制),然后观察这个区位的某几个点的变异。这个过程叫作聚合酶链式反应(polymerase chain reaction,PCR)。这个过程,就像我们复印了很多份文件,但是却只专门观察其中的一句话,观察这句话里的每一个单词的变化:是否A变成T,或C变成G?

如果一批样本中有十几个或更多的变化被同时确认,这些样本就属于一个特定的单倍群(haplogroup)。每一个人都可以归纳进某一个单倍群。单倍群是十几个或更多的变异同时遗传的。斯坦福大学团队发现的定义单倍群的标记突变通常用M(Marker)表示,例如,M9或M60表示第9个和第60个发现的突变。又如,M130就是在Y染色体的位置上,发现一个C变成了一个T。正是这些基因标记,使得我们知道了这个单倍群(氏族)与另一个单倍群(氏族)之间的关系。

基因图谱工程的科学目标,正是解读全球人类的多样性形态。其他团队也各有字母标号,如复旦团队的F。

基因图谱工程并不指望找到每一个人的先祖谱系,而是查清每一个群体的起源。最理想的样本来自世界各地的原住民,若干世纪迁移很少的原始居民的样本。这种方法类似遗传人类学(Genetic anthropology),但是考察对象是群体。从某种意义上说,基因图谱工程类似对图腾的研究,或者对印第安部落羽毛头饰的研究。这种数据库,只能使每一个人找到自己原来属于哪一个群体——时空穿梭是不可能的。换句话说,基因图谱工程要找到地球上所有现存的人类主要遗传血统。历史上的每一个谜团,随着工程的进展必定水落石出。

那么,这些单倍群是怎么编制出来的?

现在基因研究早已跨越人工观测对比X射线照片,而是全部利用电脑检测出来。

简单地说,人们利用DNA的聚合酶(polymerase),复制一大批不完整的DNA片段,再用不同的颜色在自动的测序仪器上显示出来。我们以对TCCATGGACCA的测序为例(如右图):我们使用双脱氧核苷酸(dideoxynucleotides)来复制这个DNA片段的4个碱基。每个碱基(核苷酸)用一种颜色标注:A=绿色,C=蓝色,G=黑色,T=红色。

当基因标记连续几代出现的时候,这些基因标记就产生了一个新的血统,并由后代继续传承下去

DNA的二代测序过程

DNA聚合酶把这个DNA片段作为模板来合成一个新的DNA的链。在合成这个新的DNA的链时,每添加一个核苷酸,反应停止一次,然后再添加下一个核苷酸(碱基)。在整个反应都停止时,我们得到的混合物中就产生了很多原先存在于那一个原始DNA模板(即被测序的DNA片段)中的不完整的复制片段。然后,我们通过电泳法,把这些复制的片段按照长度分类。每一类不同DNA的链条都有同样数量的双脱氧核苷酸(碱基),每一类片段的颜色都不一样。最后,我们用仪器和电脑检测、记录这些片段的颜色。按照长度不同,显示的颜色的顺序就是原始的模板DNA(即被测序的DNA片段)的顺序。

这个办法是几个诺贝尔奖获得者发明和逐步改进的,这里只是介绍简单的原理。正是采用这种办法,我们可以测试出每一个人的DNA的序列。

根据各个群体的DNA序列中的突变(编成不同代码的基因标记,例如M168、M130、M175等)的分析和对比,我们把人类分门别类,划分归纳成不同单倍体。

于是,下面的单倍体编码出来了:最上面是基因标记编码,下面用不同的颜色,区分不同的单倍群。当然,这是地球上70亿人口的单倍群。按照同样的方法继续细分,还有更多的突变(基因标记)和更详细的单倍群,70亿人每一个都是独一无二的。

现在看看这个谱系图:距离“亚当”最近的后裔是三个人:M91、M60和M168。他们的祖先正是理论上的“Y染色体亚当”。他们三个人是所有现存的70亿人的祖先。其中M91、M60两个人的后裔始终全部留在非洲,即单倍群A和B。只有M168一个人的后裔走出非洲成为世界上所有“非非洲人”的祖先。包括大洋洲、欧洲、亚洲、北美洲、南美洲。当然,M168也有后裔留在非洲。

M168又被称为“欧亚大陆亚当”(Eurasian Adam)或“走出非洲亚当”(Out of Africe Adam),这个男人的Y染色体突变发生的时间为6万—7.9万年前,地点在东非的埃塞俄比亚—苏丹一带。我们不知道M168是什么人,有些学者认为他“可能是一夫多妻制度下的一位酋长”。走出非洲的男性并非只有M168的后裔,但是M168是迄今为止唯一没有断绝的男性Y染色体血统。(www.daowen.com)

基因图谱工程采用的单倍群编码。图片来源:美国国家地理协会

O单倍群分布:冰河期巅峰时期,印尼诸岛—东南亚—东亚—日本列岛连为一体,只有澳大利亚是分离的

M168重要的后裔也有3个人,即M130、YAP和M89。约6万年前,第一批走出非洲的人类是M168的后裔M130。一部分M130沿着海岸线一直走到澳大利亚,还有一些M130留在印度次大陆—东南亚地区,他们继续北上进入亚洲的东部,即青藏高原—中国内地—蒙古—韩国—日本等地,还有一些人进入了北美洲。

约6 万年前(范围5.9 1万—6.83万年前),YAP出现了。YAP的后代现在分布在非洲—中东—亚洲各地,在非洲之外的部分数量不大,范围很广。在历史上的某个时期,不知道什么原因,这些血统在亚洲的西部、中部、南部地区灭绝了。

约4.8万年前(范围3.87万—5.57万年前),M168的最大的一个后裔血统M89出现在非洲,现在世界上大约90%的“非非洲人”都是这位M89的后裔。M9是M89的后裔,他的后裔M175(O单倍群,上图)在东南亚—亚洲东部的比例为80%—90%。也就是说,大部分东南亚国家、中国、韩国、日本的人类都是M175的后裔。

克罗马农人进入欧洲的路线也很清晰:M168-M89-M9-M45-M207-M173-M343

下面,我们简单介绍其中的几个单倍群。

U,起源于亚洲。U的进化分支已发现8个:U1-U8。其中U8的后裔发展最为普遍,被称为K。例如,在占犹太人口的80%的阿什肯纳兹犹太人(Ashkenazi Jews)中,大约32%属于K单倍群下面的3个进化分支。

阿什肯纳兹犹太人(Ashkenazi Jews),名称Ashkenazi来自《圣经》“创世记”第10章第3节中的人名,起源于中东,在11世纪约占世界犹太人的总人口的3%,1931年占世界犹太人口的92%,现在约占世界犹太人口的80%。左图人物依从上至下、从左至右排列,依次为:
Moses Isserles:犹太法典《哈拉卡》(Halakha)创建者
Vilna Gaon:多部犹太法典的创建者
Heinrich Heine(海涅),19世纪著名诗人和文学家
Sigmund Freud(弗洛伊德),精神分析学之父
Theodor Herzl(赫茨尔),锡安主义之父,最终建立以色列国家
Gustav Mahler(马勒),交响乐作曲家,指挥,音乐家
Albert Einstein(爱因斯坦),理论物理学家,现代物理之父
Emmy Noether(诺特),著名数学家
Lise Meitner(迈特纳),物理学家,第一个解释核裂变的人
Franz Kafka(卡夫卡),20世纪最伟大的文学家之一
Golda Meir(梅厄夫人),以色列国创建者之一,第四任总理
George Gershwin(格什温),作曲家,38岁去世

现在仍然不清楚,为什么有的单倍体的频率非常高,有的很低。根据蛋白类型和所在位置,这些单倍群的后裔,可以继续分为更多的类型。

这是一个令人震惊的结果。U单倍群的多样性累积时间超过五万年,难道U、H、T和V四个氏族比第一批农民J氏族更早来到欧洲吗?

J氏族是大约8 000年前来到欧洲的,绝大部分欧洲女性的线粒体DNA属于H和T两个单倍群及其进化分支的后裔,她们是自愿放弃狩猎采集的生活方式,接受农业的吗?

根据男性Y染色体的分析计算,证实确实如此。大部分欧洲人的先祖在5万—3万年前进入欧洲,他们在严酷的冰河时期,不得不退缩到欧洲的南部。

线粒体DNA和Y染色体的分析结果非常接近。80%的欧洲血统,从非洲—中东—亚洲的干草原进入欧洲地区,他们原来是狩猎采集群体,已经驯化了马。但是,在最后一次冰河期的巅峰时期,1.6万年前,北欧成为冰原地带,英伦三岛也和欧洲大陆连成一体。严酷的气候使此时的欧洲人不得不退缩到南部的“避难地”(Refugia,残遗物种躲避生态变化的区域)。这三个地区是欧洲多样性最丰富的地区,它们是伊比利亚半岛、意大利、巴尔干。这里植物动物的DNA多样性分布形态,也从另一方面证实了这三个避难区域的存在。

其他的人属生物,则在冰河期的欧洲灭绝了。它们最后的日子非常艰难,在已经发现的尼安德特人的骨头上,几乎都发现了被石器砍削的痕迹—它们互相吃掉了对方,至少可能吃掉了同类的尸体。

现代人却有了完全不同的生活。现代人类的特点是强大的免疫系统、宗教艺术。世界所有的群体都自发产生了宗教,宗教使人类结成大的群体互相帮助,群体人数远远超过其他灭绝的类人生物。即使在严酷的冰河时代,人类在欧洲也留下了几百个绘制了大量绘画的洞穴,在非洲、澳大利亚、南北美洲也发现了各种岩石壁画艺术,达尔文的“有艺术的地方,就有人类”成为一个考古的规律。

狩猎采集时代的世界总人口,估计仅仅只有几百万人,但是已经散布在全球每一个角落。也就是说,假设新石器革命时的世界人口是300万人,世界陆地面积约1.49亿平方千米,计算的结果就是当时人均土地50平方千米。

当时的地中海沿岸地区的人口,超过了世界其他地区人口的总和。冰河时代的寒冷从未抵达地中海,尤其是地中海南部的中东、北非。

冰河期结束后,人类从欧洲南部的避难地再次向整个欧洲殖民,他们不仅狩猎,还采集更多的草类种子作为食物,其中最著名的是源自卡拉卡山区(Karaca Mountains)的一种草,名字叫作小麦

虽然我们仍然不清楚细节,但是,原先的欧洲狩猎采集群体与中东的农业群体完全混血和融合了,前者的频率约占80%,后者的频率约占20%,农业成为一种文化现象出现在欧洲。

气候决定人类的兴衰。基因生物技术的这一发现,推动人类开始高度重视全球气候变暖这一世界性问题。

冰河时期的史前人类生活在温暖的欧洲南部的避难地(Refugia),并留下大量洞穴艺术,这三个避难地成为欧洲再次殖民的新舞台

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈