(一)概述
比较基因组学(Comparative Genomics)作为一门重要的工具学科,是在基因组图谱和序列分析的基础上,对已知的基因组进行比较,来揭示基因的功能、表达机理,阐明物种进化关系的学科。
传统的DNA序列比较,是基于序列与已注释的基因序列的比较而获得相应信息,但并不能进行大规模功能元件的检测,而比较基因组学通过对不同物种的基因组数据进行比较分析,揭示彼此的相似性和差异性,以了解不同物种进化上的差异,综合这些信息能进一步帮助我们了解物种形成的机制、基因或基因组上非编码区的功能,尤其是人类全基因组序列的分析与比较使比较基因组学成为整个生物学领域最新、最重要、进展最快和影响最大的学科之一。
比较基因组学分析主要有三个方面:基因组结构、编码区域和非编码区域。
(二)比较基因组学应用
1.基因组结构的比较 基因组结构的比较是在基因组测序的基础上,对基因组的核苷酸组成、基因顺序等进行对比,找出其相似性和不同,以提供个体的进化信息并指出个体基因组的独有特性。如果生物之间存在很近的亲缘关系,那么它们的基因组就会表现出共线性,即基因序列的部分或全部保守,基因顺序的变化在一定程度上能反映基因组的进化距离,因此,在DNA水平上识别共线性区域,分析不同基因组断点的组成,有助于提供基因组进化的信息。一个物种的基因组编码了成千上万的基因,以16S RNA一个序列的差异代表整个生物体的差异来研究物种间的进化关系是不全面的,而在全基因组水平上构建的进化树会更加合理地阐述物种之间的进化关系。
2.新基因的发现 比较基因组学的方法是发现新基因的重要手段,比如酵母基因组的大约60%的基因是通过序列比较分析得到的。人基因组的基因数目大约2.5万个,其中只有一小部分被人们认知,通过比较基因组学可以有效地发现新的基因,如将小鼠的Syntenic区域与人基因组比较发现了H4f5基因。(www.daowen.com)
电子克隆(in silicon cloning)是利用生物信息学技术,借助电子计算机强大的运算能力,通过表达序列标签(EST)或基因组序列的组装和拼接获得相关序列,进而利用RT-PCR快速克隆功能基因的一种方法,它是伴随着基因组计划和EST计划发展起来的基因克隆新方法。1991年,亚当斯(Adams)等首次利用EST发现了新基因,使得EST在发现新基因、基因组作图和鉴定基因组序列的编码区方面发挥了重要作用。
3.发现功能性SNP 单核苷酸多态性(SNP)是指在基因组水平上由于单个核苷酸位置上存在转换或颠换等变异所引起的DNA序列多态性。SNP在基因组中有较高的密度,为研究个体差异、生物进化提供了非常有力的数据,虽然人体基因组的差异很小,但SNP的差异导致表型的差异十分显著。比较基因组学提供了从庞大的基因组中找到功能性的SNP的有效手段,SNP的检测也已实现了自动化,检测效率大大提高,通过比较不同个体和物种的基因组序列,高通量地寻找功能性SNP。
4.拷贝数多态性(CNP) 2004年,研究发现,表型正常的人群中有些人丢失了大量的基因拷贝,而另一些人则拥有额外、延长的基因拷贝,这种不同个体在某些基因的拷贝数上存在差异的现象就是基因拷贝数多态性(Copy Number Polymorphism,CNP)。由于CNP,不同个体在疾病、食欲和药效等方面存在差异。以前,人们对基因组内的CNP数量和分布知之甚少,随着对“基因拷贝数量多态性”认识的不断深入和全基因组测序、基因芯片技术的发展,这种状况也在逐渐改变,人类对自身的遗传机制将有更深入的认识,这也将有助于人类战胜多种顽症。
5.基因组中非编码区域的结构与功能研究 基因组间保守的区域并不全是编码蛋白质的基因,很多保守区域并不编码任何蛋白,即所谓的非编码区基因,也称“垃圾DNA”或“基因荒漠”。非编码区在基因组中占据相当大的比例,对非编码区的研究也成为后基因组时代的巨大挑战。
非编码区包含大量非编码的DNA和RNA,在生命活动中扮演着重要的角色,发挥着重要的作用。研究表明,非编码区具有调控其他基因表达的功能,比如调控元件,具有重要调控功能的非编码序列,非编码区研究的一个重要内容,分析和识别这些调控元件及功能是理解基因组行为和转录调控机制的重要步骤。通过对人、小鼠、青蛙和鱼的DACH1基因及其邻近的非编码区进行序列比对,发现了在脊椎动物进化过程中保持稳定的一些基因,还发现部分非编码区DNA能提高100万个碱基对以外的基因的活性。
对非编码区的研究离不开相关数据库,这些数据库主要有转录因子数据库TRANSFAC、转录调控区域数据库TRRD、JAS-PAR数据库。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。