理论教育 基因是编码蛋白质的DNA段

基因是编码蛋白质的DNA段

时间:2023-11-26 理论教育 版权反馈
【摘要】:DNA 还包括其他一些节段和序列,它们仅有调节功能。单条多肽链可由五十至几千个氨基酸残基组成;编码这些多肽链的基因,其碱基对数目必须至少是其氨基酸数目的三倍。许多真核生物的基因和少数原核生物的基因由非编码的DNA 区段所间隔,因此,它们的DNA 长度比上述简单计算得到的更长。这些碱基对编码了约4 300 个蛋白质和115 个稳定RNA 分子的基因。

基因是编码蛋白质的DNA段

20 世纪我们对基因的认识有了巨大的飞跃。传统上把基因看成是决定或影响生物体一种性状或表现型(可见性状)的一段染色体。1540 年,George Beadle 和Edward Tatum提出一个分子水平的定义。他们将粗糙脉孢菌(Neurospora crassa)的真菌孢子暴露于X-射线照射或其他已知的能引起DNA 发生改变(突变)的试剂后,检测到缺少一种或另一种特异酶的突变真菌菌株,有时会导致整个代谢路径都不能进行。Beadle 和Tatum 作出结论认为,一个基因是能决定或编码一种酶的一段遗传物质即一个基因一个酶假说(One gene-one enzyme hypothesis)。后来这一概念被扩展为一个基因一个蛋白质(One geneone protein),因为许多基因编码的蛋白质并不是酶。

基因的现代生物化学定义更加准确。我们知道,许多蛋白质有多个多肽链。在某些蛋白质中,所有的多肽链都是相同的,都是由相同的基因编码的。另外一些蛋白质有两条或以上的不同的多肽链,各自有不同的氨基酸顺序。如成人血红蛋白A 有两种不同的多肽链,α 和β,它们的氨基酸序列不同,是由两个不同的基因编码的。因此,基因和蛋白质之间的关系用“一个基因一条多肽链”(One gene-one polypetide)来描述更为准确。

即便是这种定义也不足够准确,因为并不是所有的基因都最终由多肽链来表达。例如,有些基因编码tRNA 和rRNA,所以一个完整的定义必须得包括这些基因。因此,基因是编码终产物为一种多肽链或一种具结构或催化功能的RNA 的所有的DNA。DNA 还包括其他一些节段和序列,它们仅有调节功能。调节序列提供基因开始或结尾的信号,或影响基因的转录,或作为复制或重组的起始点。(www.daowen.com)

编码蛋白质的基因的最小整体大小可直接估算。一个多肽链中的每个氨基酸都是由一条DNA 链上三个连续的核苷酸所编码的,这些编码的“三联体”(Triplets)的排列顺序对应于此基因所编码的多肽链上的氨基酸顺序。单条多肽链可由五十至几千个氨基酸残基组成;编码这些多肽链的基因,其碱基对数目必须至少是其氨基酸数目的三倍。一条有350 个氨基酸残基的多肽链有1 050 个碱基对。许多真核生物的基因和少数原核生物的基因由非编码的DNA 区段所间隔,因此,它们的DNA 长度比上述简单计算得到的更长。

一条染色体上有多少基因呢?大肠杆菌的染色体是已被完全测序了的原核生物基因组之一,它是一种环形DNA 分子(实际上是一个没有终点的环,而不是一个完美的圆圈),具有4 638 858 个碱基对。这些碱基对编码了约4 300 个蛋白质和115 个稳定RNA 分子的基因。对于真核生物我们了解得就没有那么完全了,人类基因组的30 亿个碱基对在其24 条不同染色体上编码了3 万~3.5 万个基因。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈