理论教育 基于宏基因组学方法的新酶发现

基于宏基因组学方法的新酶发现

时间:2023-11-18 理论教育 版权反馈
【摘要】:在基于宏基因组学的筛选方法中,这种策略应用最为广泛。该技术允许对含有数以百万计DNA片段的复杂宏基因组文库进行直接和快速的筛选。已知酶的同源基因可以从现有的宏基因组学数据中直接获取并用于酶分子合成及表征。大规模深度DNA测序或宏基因文库的建立为发掘新型酶序列提供了原始数据序列。考虑到蛋白质家族的分类是基于氨基酸同源性,新的酶家族无法通过数据库搜索、比对宏基因组序列或PCR的方法来发现,并可能被注释为假想蛋白。

基于宏基因组学方法的新酶发现

自然界中很多微生物是难以人工培养的,从这类微生物中发掘新酶非常困难。随着技术的不断进步,从不能培养的微生物中发掘新酶逐渐成为了可能,基于宏基因组学的方法包括直接从环境样品中提取微生物DNAs克隆到合适的表达载体、转化到易于培养的细菌、分离理想的克隆,以便进行酶鉴定和表征。这一策略有效减小了产酶微生物的生长限制,使可培养和不可培养微生物的遗传物质均可用。数十亿年来,自然界已经产生、进化和选择了无数的具有功能多样性的酶及与其关联的生化途径。利用这一丰富的多样性,来源广泛的微生物将为我们提供新的以及更适合的生物酶。从宏基因组库中发现新型酶通常依赖于两种策略:基于功能的筛选和基于序列的筛选。

(一)基于功能的筛选

基于功能的筛选以所需酶的活性作为筛选依据。在基于宏基因组学的筛选方法中,这种策略应用最为广泛。最近,新的筛选标记如报告基因[绿色荧光蛋白(GFP)、抗生素抗性标记等]和互补实验的使用进一步扩大了其应用范围。但是,酶活性的鉴定取决于几个有决定性和相互关联的因素,特别是宿主—载体系统,在一定程度上导致这种策略命中率低。因此,近期相关研究集中在提高表达系统的效率。例如,Lämmle等为增加转录克隆插入的机会,设计了一种双向质粒表达载体。在多种酶的筛选实验中,成功率可达10-4~10-3,说明这个系统有着广泛的应用前景。在另一研究中,郑等构建了两个载体并在多种宿主中复制。这种方法用来创建高质量宏基因组文库,获得高达9×106个克隆。同时构建合适的异源宿主工作也在开展,以用于提高宏基因组基因表达的效率。例如,伊克巴尔等用Ralstonia metallidurans作为表达宿主,表达亚利桑那州土壤宏基因组文库,并用这种方法鉴定了几种未能在大肠杆菌中表达的酶。这项研究清楚地说明了多元化的宿主在表达宏基因组文库中的重要性。然而由于其良好的可操作性,目前大肠杆菌仍是主要的表达宿主。

目前使用最广泛的基于酶活性的筛查方法是采用与底物相关的化学染料或者不溶性化合物或者显色物质。当这些物质加入生长介质中后可以用于检测具有特定催化功能的克隆。如有报道用乳牛瘤胃中微生物构建了一个宏基因组噬菌体文库,然后通过筛查水解酶活性检验了瘤胃酶的多样性,分离和表征了22个具有不同水解活性的克隆,其中4种水解酶和公共数据库中的序列没有同源性。这4个克隆中预测的催化残基和同类酶中的催化氨基酸残基都不一样,可能是新型水解酶。从两个不同蚯蚓品种中可降解纤维素微生物的群落构建了宏基因组fosmid文库。通过基于酶活性的筛选发现了10个可以修饰碳水化合物的酶,其中两个糖苷水解酶代表了两个新的β-半乳糖苷酶/α-阿拉伯糖苷酶家族。此外,其他成功例子的报道也很多,如新型糖苷水解酶、几丁质酶、木聚糖酶、羧酸酯酶和脂肪酶等,这说明基于酶活性的检测方法可以成功地应用于不同类型新酶的发掘。

另一种酶活性检测方法是基于宿主菌株需要有针对性的基因异源互补。在该策略中,宏基因组插入的基因包含宿主细胞生存必需的互补因素。只有当具有互补能力的基因被引入宿主细胞中,宿主细胞才能生存。该技术允许对含有数以百万计DNA片段的复杂宏基因组文库进行直接和快速的筛选。因为很少出现假阳性,所以这种方法具有高度的选择性。然而,这种策略仅仅限于酶的底物是菌株生存所必需的,而且对应的营养缺陷型宿主是容易构建的情况。文献中已经报道的例子表明,这种方法可以用于不同酶,如消旋酶、DNA聚合酶、β-内酰胺酶、醇脱氢酶以及参与聚羟基丁酸酯代谢的酶等。

应用实例】从猪粪便宏基因组发掘新型几丁质酶。

应用基因组步移的技术从猪粪便宏基因组中克隆一种新型外切几丁质酶基因,并进行异源表达、纯化得到重组酶(Echi47)和进一步研究了其酶学性质。通过实验证明:该酶分子质量为47kDa;最适反应pH为5.0,最适温度为40℃,在pH为4.0~9.0和温度<50℃的范围内保持稳定;在模拟胃肠道环境中保持很高的稳定性和酶活力;该几丁质酶能够水解胶体几丁质,主要释放出几丁二糖(图3-3)。(www.daowen.com)

图3-3 猪粪便宏基因组来源重组几丁质酶的纯化(1)及水解特性(2)分析图

(1)重组几丁质酶的纯化电泳图,M—标准蛋白,1和2—分别代表粗纯化前后几丁质酶(2)几丁质酶Echi47水解胶体几丁质产物薄层层析(TLC)分析图

(二)基于序列的筛选

基于序列的筛选通过使用DNA探针或者简并引物,用PCR方法从宏基因组文库中获取目标基因。用这种方法发现了许多已知酶的同源蛋白,例如自足型的P450单加氧酶(monooxygenase)。在另一工作中,研究人员用基于序列的筛选方法从不可培养微生物宏基因组文库中筛选了一个新型的预苯酸脱氢酶基因。DNA合成技术的发展进一步促进了这种筛查策略的应用。已知酶的同源基因可以从现有的宏基因组学数据中直接获取并用于酶分子合成及表征。例如,Voigt公司鉴定了61种细菌、13种真菌、1种古细菌和 14种植物卤化甲基转移酶(MHT)基因,并优化了它们的密码子用于大肠杆菌中表达。这些酶的生化特性显示,它们中的94%是卤化甲基转移酶,但所有鉴定的基因中仅有一种在数据库中被准确注释。因此,通过基因合成,基于序列的筛选策略可以充分揭示通过自然进化赋予的同一功能序列的多样性。然而,这种方法局限于对序列同源性比较高的酶家族的研究。

基于序列的筛选方法已发现了多种酶,如聚糖降解酶、甘油脱水酶、双加氧酶、亚硝酸盐还原酶、肼氧化还原酶、几丁质酶、糖苷水解酶、腈水解酶和半纤维素酶等。基于序列的筛选方法涉及蛋白质家族保守区的PCR引物。依赖前期知识限制了发掘新酶家族的可能性。大规模深度DNA测序或宏基因文库的建立为发掘新型酶序列提供了原始数据序列。基于同源序列的方法只有当信息参考序列准确率很高的时候才有效。另一个不足是其依赖现有的基因组注释和当前数据库的质量及完整性。遗憾的是,在当前数据库中许多基因组没有正确注释。

考虑到蛋白质家族的分类是基于氨基酸同源性,新的酶家族无法通过数据库搜索、比对宏基因组序列或PCR的方法来发现,并可能被注释为假想蛋白。近期对宏基因组原核蛋白质多样性的研究表明,30%~60%的蛋白质不能使用当前公共数据库来预测功能。因此,最近有研究报告指出基于酶活性的方法比基于序列筛选的方法要可靠。通过功能筛查,在南极土壤样本中找到了一个新的耐冷酯酶,其氨基酸序列同源性较低(<29%)。这个酯酶和任何基因库中的核苷酸序列没有同源性,因此不太可能会通过PCR筛选方法或通过深度测序技术筛选到。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈