理论教育 人类基因组的决定者:Y染色体和亚当

人类基因组的决定者:Y染色体和亚当

时间:2023-11-23 理论教育 版权反馈
【摘要】:这22对染色体,构成我们基因组的主要部分。这一对染色体的作用是决定下一代的性别,所以被称为性染色体。是的,我们体内确实存在着一种“抵抗重组”的力量,其中一部分就在Y染色体上。Y染色体可以从儿子—父亲—祖父一直向上追溯,现在活着的每个男人的DNA,最后都可以追溯到第一个男性先祖—“亚当”。

人类基因组的决定者:Y染色体和亚当

夏娃”找到了:15万年前,在非洲。

但是,这是不是唯一的“夏娃”?非洲是不是唯一的伊甸园?

这个“夏娃”,确实是根据线粒体DNA(mtDNA)上溯推算出来的人类谱系树(family tree)的根。我们所有的人都分享着她一个人的线粒体,这是确凿无疑的。但是,我们需要另外的佐证。我们有23对染色体,其中22对染色体随着一代又一代的重组,携带的信息从人间消失了:多态性湮灭了先祖的影子。这22对染色体,构成我们基因组的主要部分。也就是说,我们基因组的大部分,对于上溯和追踪先祖毫无用处。在人类的23对染色体中,最终证明只有最后一对染色体是个无价之宝。这一对染色体的作用是决定下一代的性别,所以被称为性染色体。这个染色体叫Y染色体,和线粒体一样,可以上溯和追踪我们的先祖。

线粒体DNA相对比较简单,它是远古时代的一个寄生细菌,其基因组与遗传染色体基因组不同。Y染色体相对复杂一些,它的遗传与众不同,女性后裔是一个X和一个X染色体配对,男性后裔是一个Y和一个X染色体配对。这个Y染色体只能由父亲传承给儿子,然后进行细胞的分裂—复制—分裂—复制过程。无论经历多少代,都不会因为多态性而从人间消失,亦即无法湮灭父系祖先的影子,这个特点与仅仅经由母系遗传的线粒体DNA的性质一样。

我们如果“放大”观察染色体的结构,就可以看到:紧紧的“严密包装”使得大量DNA可以存放在很小的细胞核
1.在一个真核细胞的细胞核里,有一定数量的染色体。上图是复制的人类染色体
2.在最致密的时候,复制的染色体“严密包装”成为X形
3.当我们把染色体像一根纤维丝一样打开时,染色体像一个螺旋弹簧构成的空心管子
4.在这个螺旋弹簧一样的结构中,包括一个长长的DNA分子(蓝色),这个DNA分子包裹着的各种蛋白(紫色)
5.每隔一个规律的间距,DNA分子就围绕一个组蛋白(histone)的核心绕两圈。这种结构好像一条“珠子项链”,其中“项链”是DNA,“珠子”是核小体(nucleosome)
6.DNA分子本身是两条链,缠绕成为双螺旋结构

Y染色体和线粒体DNA的另一个区别是大小:线粒体DNA比较小,大约1.6万个字符核苷酸);Y染色体大得多,大约6 000万个字符(核苷酸)。也就是说,在漫长的历史中,Y染色体的长长的链条上,可能发生复制错误(突变,mutations)的部位的数量比线粒体DNA多了几千倍。Y 染色体不参与精子和卵子形成新基因组的过程(重组),否则,我们既不能仿照朱科康德尔和鲍林的密码破译,也不能利用“奥卡姆剃刀”——乱码无法破译,先祖也就找不到了。难道我们的体内存在一种抵抗重组的势力?这不是与产生多样性以适应外界环境的变化趋势互相矛盾吗?是的,我们体内确实存在着一种“抵抗重组”的力量,其中一部分就在Y染色体上。

产生变化的活跃基因数量并不多,它们在基因组不同部位的分布也不平均,各个部位的活跃基因的数量差别也很大。例如:在线粒体DNA里,活跃基因有37个;在细胞核基因组里,活跃基因约30 000个(平均每对染色体约1 500个)。那么,究竟是什么原因使大量的基因丧失了活跃性呢?

我们首先看看线粒体。线粒体是我们的细菌先祖吞噬的一个寄生古细菌,在几十亿年的进化过程中寄生性不断增大,逐步放弃“自治权”后,线粒体在细胞里过着舒适生活,绝大部分基因已不参与重组。

我们再来看看Y染色体。Y染色体活跃基因丧失的情况与线粒体类似,虽然平均每对染色体有1 500个活跃基因,但是Y染色体上只剩下21个活跃基因,其中一些基因还是重复的,随机复制的。更有趣的是,这21个活跃基因只参与一项工程——制造男性。其中一个基因决定性别,称为Y染色体性别决定区,缩写SRY(Sex-determining Region of the Y)。其他的活跃基因负责决定其他男性特征(例如男人的外貌、长相、行为举止等)。Y染色体上的其他基因什么功能也没有,被称为“垃圾DNA”(junk DNA)。这些“垃圾DNA”也许是生物学的垃圾,却是群体遗传学家的金砂。

如前所述,我们只能通过寻找差异研究人类的多样性。差异决定了每一个人都是独一无二的,除非我们身上没有多态性(只有同卵孪生子例外)。Y染色体可以从儿子—父亲—祖父一直向上追溯,现在活着的每个男人的DNA,最后都可以追溯到第一个男性先祖—“亚当”。但是,如何把毫无关联的男人们联系起来?是不是每一个男人都肯定能从自己独一无二的Y染色体里追溯到“亚当”?

答案是否定的。原因有些复杂,因为我们并不是毫无关联的。每一个人,都继承了父亲和母亲的一半基因组,具有独一无二的新的基因组。实际上,我们的基因组,我们的父母的基因组,我们所在群体的基因组都是独一无二的。地球上,没有两个群体的DNA中记录的故事是相同的。

现在,我们计算一下我们的血统中,父系基因组的比例和我们的祖先数量。我们可以一步一步地推算:我们具有50%的父亲的基因组,25%的祖父的基因组,12.5%的曾祖父的基因组,6.25%的曾曾祖父的基因组……继续这样的理论计算,最后的结果惊人。

500年前,现在的每一个人理论上都会有超过100万个祖先;1 000年前,每一个人理论上有超过10亿个祖先——这个数字已经超过现有的全部地球人口。

难道我们的计算出了什么差错?在数学上,这个答案显然是正确的,希腊时代的人们已经掌握了这些计算方法。电脑也没有错。但是,我们计算的假设错了。我们是在“谱系中的每一个人都毫无关联”的假设下进行计算的,但是人们会共享谱系,虽然共享的情况互不相同。

信天翁是一种巨大的海鸟,翼展超过3.5米,可以在天空长期翱翔,可以闭上眼睛一边睡觉一边继续飞行,所以它们可以飞行几周不必落地,可以一次跨越上万千米。但是,它们总是回到它们出生的岛屿繁殖,它们的配偶也会飞回同一个岛屿幽会。下一代信天翁出生之后,即使飞得再遥远,也会在繁殖时期回到它们出生的岛屿。繁殖期结束之后,它们互相告别,再次飞往无边无际的大海的上空。

人类的行为与此类似,总是与自己的“邻居”——相近的游牧部落,或者相邻的村庄之间,甚至亲戚之间交换配偶。有的群体的习惯是在第三代血亲之间,有的群体的习惯是在第二代血亲之间。这些交配都是随机发生的。如果一个群体迁移了,他们又有新的邻居,又开始与新的邻居交换配偶。这种区域婚配习惯的结果,使得同一区域的群体之间越来越接近,与不同区域的群体之间的差异越来越大。如果两个第三代的表兄妹结婚了,从遗传学的角度来看,这两个父母并非无关的,而是关联的。这两个配偶之间的一部分基因组是相同的,这里的2×2不等于4,因为两个2都小于2。所以说,我们前面的数学计算的假设是错误的。

黑眉信天翁

这个基因组比例成分的乘法继续下去,我们祖先的数量不是越来越大,而是越来越小,最后只剩下一个人——“Y染色体亚当”。正如前面的列文庭的分析:向上追溯,“亚当”和“夏娃”都没有消失,他们还在那里,只是需要更多的研究—计算—分析……Y染色体是追寻“亚当”的一张王牌。

1991年,斯坦福大学的斯福扎实验室里来了一个应聘的青年人,彼得·安德希尔(Peter Underhill)。安德希尔早年在特拉华大学(University of Delaware)从事海洋生物学研究并获得博士学位,后来到加利福尼亚州,转向研究酶在分子生物学中的应用。1980年代正是生物技术大发展的初期,硅谷是重组DNA的震中。如何用各种各样的酶切割基因—分离基因—黏合基因……各种生物技术与电脑技术相互辉映,电子和生物两大技术领域将旧金山湾区变成了一个朝气蓬勃的全球新兴技术中心。(www.daowen.com)

斯福扎留下了安德希尔,请他进行线粒体mtDNA的序列研究。但是,彼得的兴趣很快转向了Y染色体。当时,分析化学极其困难。遗传学家的主要武器之一是从最基础的分子分离DNA片段的能力。与蛋白质一样,DNA是在我们的细胞里以核苷碱基(nucleotide bases,简称碱基或者核苷酸)为建材构成的一种长链。人类基因组的核苷酸数量约为30亿个,必须通过一些技术,把这种分子混合体分离开来,才能检测出每一个DNA分子上的核苷酸的序列。首先,要通过一些生物化学技术,把某一个小片段的DNA,严格按照它们原来的序列多次再造出来。制造出这些DNA的小片段后,再在一种类似凝胶的基质(gelatine-like Matrix)中制造电场,以电场的力量把它们分离开来。

DNA带有负电荷,所以,DNA的小片段会在凝胶基质中,向正电荷的方向移动——分子水平的微小移动。微观上,凝胶内部是弯弯绕绕的无数微小通道。DNA的分子在凝胶中的移动迟缓笨拙,其移动的程度取决于分子的长度,分子越长,移动程度越低,因为较长的分子要携带更多的物质通过凝胶内部的通道。在正电场的这种作用下,不同的DNA分子就分离出来了。这叫作DNA的测序(sequencing)。

DNA或RNA的测序

这个理论很复杂,实施起来却很有效。在过去的30年里,几乎每一个重要的遗传学发现都离不开这种技术。例如,人类基因组的序列分析就要重复实施几千万次到几亿次这样的测序。这种技术虽然有效,工作量却巨大得可怕。测序的另一个问题是进度非常缓慢。只有经过生物化学反应,才能确定DNA的分子序列,所以这种研究代价高昂,很多遗传学家希望找到更快更便宜的办法。

彼得·欧依夫内尔(Peter Oefner)是一位来自奥地利的化学家,当时也在斯坦福大学读博士后,他正在研究一种分离分子的技术,叫作高效液相色谱(High Pressure Liquid Chromatography,简称HPLC)。这种技术如果用于DNA分子,比凝胶方法快得多。有一次,安德希尔在遗传学系的讲座上,看到欧依夫内尔介绍HPLC技术,安德希尔马上想到把这种技术用于Y染色体的多态性分析上。他询问欧依夫内尔是否愿意和他一起合作?两个彼得,一拍即合。此后的18个月,两个彼得放弃周末休息,一起投入了疯狂的实验。

两个彼得的合作,诞生了一种新的HPLC技术,简称dHPLC。这种技术可以用于快速检测DNA分子复制中的偶发性错误。dHPLC技术又快又便宜,节省的时间令人瞠目结舌。过去,人们在Y染色体上仅仅发现了十几个多态性,dHPLC技术出现后,每个星期都能找到Y染色体的多态性。这种新的测序分析方法的实质是:“忽视”具体的DNA序列,仅仅分析计算DNA序列之间的差异。

这两个彼得发明的新办法,终于使人类找出了“夏娃”的伴侣——“亚当”。2000年11月的《自然遗传学》(Nature Genetics)上,发表了一篇21个人署名的论文,结论是Y染色体最早的分离起始于非洲的先祖。这个答案与线粒体mtDNA的母系的研究完全吻合。但是,“亚当”诞生的时间——推算出来的Y染色体分离时间是在5.9万年,与“夏娃”的年龄差距超过8万年。

“亚当”和“夏娃”,难道根本没见过面?

这个问题不能这样理解。所谓“亚当”和“夏娃”,只是科学研究中假设的两个遗传学实体概念。遗传学首先回答的一个问题是:“我们与黑猩猩三文鱼是不是一个物种?” 然后,我们把人类的父系先祖和母系先祖假设为“亚当”和“夏娃”。遗传学研究是从现在活着的人群中,寻找形形色色的DNA差异(多样性和多态性),最终得出一个结论:人类是一个人种,人类的祖先在非洲。遗传学只是逐字逐句地解读DNA写出的天书,其中很长的一段时间究竟发生了什么?在几千代的代代繁衍中,深藏了哪些故事?遗传学无法回答,因为目前还没有更多的变异和差异数据可以告诉我们确切的答案——“奥卡姆剃刀”,已经没有什么可以再刮了。

“亚当”和“夏娃”的年龄,并不代表我们这个物种的出现时间。“亚当”和“夏娃”是Y染色体和线粒体DNA分别编织出的色彩斑斓的两个大挂毯,我们带着这两块地毯走向世界各地。“亚当”和“夏娃”分别是人类遗传的两个合并点(Coalescence point),“夏娃”不可能等待“亚当”几万年。2000年11月的论文估算的“亚当的年龄”是一个范围:4万—14万年,最有可能在5.9万年。这是一个没有任何悬念的科学事实。

这一研究结论,彻底否定了多起源说。这一研究结论,也是一个巨大的震撼。我们这个物种出现在非洲不到20万年,但是,非洲发现的最古老的类人猿化石已有2 300万年的历史——这是一个难以想象的时间,假如我们把这个时间压缩为一年的365天,则如下图所示:

1月1日,猿人出现了:第一个千禧人开始直立行走人科动物

10月底,类人猿出现了。

12月初,直立人出现了:200万年前他们走出非洲,后来全部灭绝。

12月18日,智人出现了;80万年前走出非洲。

12月28日,现代人出现了。

12月31日,深夜11点,人类开始走出非洲:不到1个小时。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈