理论教育 湮灭的先祖:人类六万年基因历史

湮灭的先祖:人类六万年基因历史

时间:2023-11-23 理论教育 版权反馈
【摘要】:由于并非消失,所以称为湮灭注:这种染色体之间产生的差异,称为突变。几百代或几千代之后,这些染色体的那一个共同先祖的多态性就会完全丧失。由于重组带来的变异,使分子钟也无法使用,因为分子钟可能高估或低估了我们的共同先祖的存在时间。这就是非洲的多样性数量巨大的原因,“非洲的人类历史最古老”这一结论也由此确定。

湮灭的先祖:人类六万年基因历史

血型、蛋白、DNA,遗传基因研究的战场不断转换。

发现DNA双螺旋结构的两个诺贝尔奖得主之一的克里克发现,遗传信息的单一方向流动顺序是DNA-RNA——蛋白。虽然人们曾经把这个顺序的方向完全搞颠倒了,但是积累的研究成果还是有用的。1980年代,人们发现分子生物学领域开发的新工具可以借来处理群体多态性,从分子序列数据估算出各种时间,直到回答一个古老的问题——人类的起源。

上图中,长条是其他染色体,短条是Y染色体,圆圈是线粒体DNA。染色体经过一代又一代混合,先祖原来的染色体不见了(湮灭重组)。由于并非消失,所以称为湮灭

注:这种染色体之间产生的差异,称为突变。在英语中,突变(mutations)是一个单词,变异、变化和差异又是不同的其他单词,这些单词的含义并不相同。在中文里,这些单词的含义非常接近,往往被忽视(尤其是突变一词)

分子生物学家面临的难题是DNA信息复制的特性。我们的基因组(genome,又称染色体组)携带构成人体的全部编码,其中还有很多DNA的作用不明。这个基因组有两套复制品存放在两组染色体里。染色体里存放这些遗传资料的“字符核苷酸(nucleotides)的数量大约30亿个。解决的方法只能是找到直截了当读懂这么多文件的办法。但是两套染色体使问题更加复杂。精子进入卵子时,父亲的基因组和母亲的基因组以50∶50的比例混合形成一个新的基因组。而且,每一代都要产生一个新的基因组。从生物学角度来说,性就是产生一个新基因组。性产生新基因组的重新组合,称为遗传重组(genetic recombination)。两套染色体从中间分开,再次黏附到另外一半染色体上,构成新的染色体。分裂—复制—分裂—复制……有时甚至形成荒诞不经的奇怪的染色体。这也许是一件好事,因为环境变化了,我们也要变化应对。

那么,分开后再重新聚合在一起的染色体,是否与原来的染色体不同?它们是一模一样的复制品吗?答案是不一样。新的染色体绝对不一样,它们在整个链条上的很多地方都不一样。原因很简单,染色体原本就是复制品的复制品的复制品的复制品……根本不存在绝对完全一模一样的两条染色体,随着时间的推移,复制机器中产生的少量随机差异也被复制,突变(mutations)产生了。

染色体上,大约每1 000个“文件夹”核苷酸中存在1个突变。这个突变是两个染色体的差异。因此,当父亲和母亲的染色体结合时,每一个新的基因组—婴儿也是不同的。同一个DNA片段,就是这样和多态性联系起来了。这种多态性的产生机制,对于进化是一件好事,但是却使得分子生物学家的人生变得异常艰难。重组使一个染色体上的每一种多态性都是独一无二的,都与任何其他染色体不同。随着时间的推移,多态性重组—重组—重组—重组……几百代或几千代之后,这些染色体的那一个共同先祖的多态性就会完全丧失。这被称为湮灭。

由于重组(又被称为湮灭重组)带来的变异,使分子钟也无法使用,因为分子钟可能高估或低估了我们的共同先祖的存在时间。也就是说我们后裔染色体完全变了,先祖的痕迹消失了。我们找不到先祖,也无法用“奥卡姆剃刀”刮掉多态性的形态——与我们的不复存在的先祖的染色体相比,我们根本不知道发生了哪些变化。

寻找亚当的道路,再次遇到困难。(www.daowen.com)

1980年代,人类在细胞里发现了一个小的结构:线粒体(mitochondrion)。2000年代,人们终于知道,线粒体是十几亿年以前第一批复杂细胞进化过程中留存下来的一类细菌。也就是说,我们的单细胞先祖们曾经吞噬了一种古代细菌,因为这种细菌在细胞内部可以生产能量,最后,这种被吞噬的古代细菌从一种“寄生虫”演变成一座亚细胞能量工厂(sub-cellular power plant)。非常幸运的是,与细菌的基因组类似,线粒体基因组(mitochondrial genome或者mtDNA)只有一套复制品,也就是说,它们不会重组。光明和希望再次出现。

细胞核基因组里,大约每1 000个核苷酸里就出现一个多态性,比例比较少。而在线粒体基因组里,大约每100个核苷酸里就出现一个多态性,比例要远远大得多。在进化对比中,我们希望找到尽可能多的多态性,因为每增多一个多态性,都会增大我们区分两个个体的能力。打个比方:如果我们仅仅测定一个多态性,具有两个类型,类型A和类型B,我们可以把这个多态性归纳为两个类型,仅仅用变异A或变异B来表示。如果我们在两个变异上,分别看到10个多态性,问题好办多了,因为多个个体具备完全相同的变异组合的可能性很低。换句话说,找到的多态性越多,就可以找到推断人群关系的更有意义的形态—线粒体DNA(mtDNA)的多态性比细胞核基因组的多态性增大了10倍,这里正是观测的好地方。

为什么多态性越丰富,表示的年代越长?

让我们再次回到前面假设的古代村庄。为什么这个村庄里,每一户人家的祖传的鱼汤配方改变了?因为每一代都有一个女儿少量改变了鱼汤的成分,随着时间的推移,这些小小的差异造成鱼汤的多样化更加丰富。累积的变化时间越长,鱼汤的种类更加分离,我们在鱼汤里看到的差异也就越多。

艾米尔·朱科康德尔研究蛋白质时提出的“分子钟”,与此道理相同。从DNA差异的角度来看,对于一个特定的群体,这个群体存在时间越长,遗传差异累积越多。反过来看,如果我们发现一个群体的遗传差异越多,即可推断这个人群的存在时间越长。人类进化树的所有分支的进化速率都是相同的,无论是在走出非洲之前还是之后。这就是非洲的多样性数量巨大的原因,“非洲的人类历史最古老”这一结论也由此确定。由于进化的速率相同,我们还可以对比每一个进化分支的差异数量,从而得到人类进化的各个分支的大概时间。

左图:南非摄影家Ariabne Van Zandbergen的作品,这个埃塞俄比亚女孩的部落恰好位于发现19.5万年前第一个现代人化石的奥姆河谷
右图:米开朗琪罗的雕塑大卫》(David),世界上最著名的男性形象雕塑,每年参观者达数百万人

无论是推算人类的共同祖先,还是推算人类的各个分支,都可以采用相同的速率。也就是说,世界各个群体的进化速率完全相同,无论是非洲草房里的牧民,泰国渔船里的渔民,还是巴西草原上的猎人,距离单一的共同先祖的时间都是相同的。世界各地的各个群体之间的区别,仅仅是不同群体基因变异的数量及其表达(多样性和多态性)。

现在我们终于知道,距离单一的共同先祖的时间大约15万年。“夏娃居住的非洲伊甸园在哪里”这个我们一直希望得到答案的古老问题本身就是错误的,这个问题没有答案,因为非洲生活着无数的女性。所以,正确的问题是:非洲的哪一些人群(群体)仍然保留着距离我们的遗传学先祖最接近、最清晰、最明显的痕迹?在这些群体里,保留着追踪到“夏娃”的一种直接的线粒体的关联。而在其他各大洲,这些遗传信息随着人类的旅程,越来越少,甚至看不清楚了。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈