理论教育 高级微生物学:组学时代的微生物生态

高级微生物学:组学时代的微生物生态

时间:2023-11-21 理论教育 版权反馈
【摘要】:现代分子生物学技术的引进,大大推动了微生物生态学的发展。报告指出,宏基因组学为探索微生物世界的奥秘提供了新方法,这可能是继发明显微镜以来研究微生物方法的最重要进展,将对认识微生物世界带来革命性突破。

高级微生物学:组学时代的微生物生态

微生物是生物地球化学循环中的关键驱动者,蕴含着丰富的功能基因资源,进行各种代谢过程。传统的纯培养技术仅能获得1%左右的微生物资源。现代分子生物学技术的引进,大大推动了微生物生态学的发展。1998年首次提出宏基因组的概念,将研究范围扩大到环境中所有微小生物的遗传物质总和。宏基因组学直接针对从环境中提取的微生物遗传物质进行分析研究,不必进行纯培养步骤,可以直接根据不同的研究目的对环境样品中的所有DNA序列进行分析。宏基因组学研究极大地扩展了对于环境微生物群落的基因组成、意义以及遗传变异等方面的知识。宏转录组学技术研究可以了解复杂微生物群落中的代谢和功能等方面的信息。

一、宏基因组学技术

1998年,Handelsman J.正式提出了“宏基因组”(metagenome)的概念,即环境中所用微生物基因组的总和。宏基因组学又称元基因组学、环境基因组学,主要研究从环境样品获得的基因组中所包含微生物的遗传组成及其群落功能,克服了传统微生物学基于纯培养研究的缺陷,为充分研究和开发利用未培养微生物,并从完整的群落水平认识微生物活动提供了可能。

2007年,美国科学家联合会(National Academies)发表了以“环境基因组学新科学——揭示微生物世界奥秘”为题的报告。报告指出,宏基因组学为探索微生物世界的奥秘提供了新方法,这可能是继发明显微镜以来研究微生物方法的最重要进展,将对认识微生物世界带来革命性突破。报告同时呼吁建立全球宏基因组学研究计划(Global Metagenomics Initiative),对自然环境生物群落(海水或土壤等)、寄生微生物群落(人体肠胃或口腔等)、人为控制环境微生物群落(污水处理厂或水厂养殖场等)等开展研究。

1.宏基因组学技术的基本原理

宏基因组学最初是用来定义土壤细菌的混合基因组,现在则指环境中全部微小生物体遗传物质的总和,并且主要针对环境样品中细菌和真菌基因组的总和。这项技术以基因组学技术为依托,直接从环境样品中提取微生物总DNA,将DNA克隆到载体并转化到宿主细胞,建立环境基因组文库,并对环境基因组文库进行分析和筛选。

2.宏基因组学技术的基本操作过程

宏基因组学技术涉及环境样品总DNA的提取、载体和宿主菌选择、文库筛选策略等多方面内容。前端关键性的技术是环境微生物总DNA的提取,提取方法的精确程度直接影响文库中微生物信息的精确度;下游关键性技术是文库的分析与筛选技术(图7-28)。

图7-28 宏基因组学的研究流程

(1)环境DNA的提取获得高质量的环境样品基因组DNA是宏基因组学研究的关键步骤。既要尽可能提取样品的基因组DNA,又要保证基因组的完整和纯度。获得高分子质量DNA是从文库中获得完整基因簇的前提条件。但是,由于环境样品较为复杂,微生物细胞易吸附于颗粒表面,并且某些金属离子、土壤腐殖质、各种抑制剂等物质的存在,难以获得适于构建宏基因组文库的高分子质量DNA。因此,提取环境DNA时,既要保证提取率高,又要保证基因组的完整性和纯度,技术水平要求较高。从DNA所包含的信息广泛度分析,环境样品DNA提取技术具备区分微生物体细胞内DNA与细胞外DNA、活细胞DNA与死细胞DNA的能力。但是,运用现有DNA提取技术能够回收环境中多少类型微生物的核酸信息仍然不清楚。

环境基因组学的提取方法主要包括间接提取法和直接提取法两种。直接提取法又称为原位提取法,是指样品不进行预富集而直接破碎微生物细胞获取DNA并进行纯化的方法,主要包括SDS高盐抽提法和溶菌酶法。SDS高盐抽提法先溶解微生物细胞,再提取环境样品DNA,细胞溶解效率为67%~92%。溶菌酶法是通过结合溶菌酶和冻融程序进行的直接提取方法。此外,原位提取法中的细胞溶解和破碎处理还可采用反复冻融、液氮研磨、超声破碎等方法。间接提取法又称异位提取,是用物理方法把微生物从样品中分离出来(预富集),然后用较温和的方法进行总DNA提取。与直接提取法相比,间接提取法获得的DNA纯度高,片段大,但是产量及所包含的基因组信息不够。

(2)基因组文库的构建 构建宏基因组文库需要根据DNA片段大小选择合适的载体。小片段DNA(<10bp)可插入到质粒载体中,在宿主E.coli中克隆表达;大片段DNA插入到考斯质粒(cosmid)或细菌人工染色体(BAC)中,在宿主E.coli中克隆表达。宿主选择范围的扩大及克隆载体的改良对于提高宏基因组克隆子的异源表达水平非常关键。例如,高GC含量eDNA片段中的生物合成基因簇有可能在链霉菌类的宿主中才能实现有效异源表达。新型穿梭细菌人工染色体、穿梭考斯质粒、广宿主考斯质粒等载体的发明使得不同宿主的平行使用成为可能。经序列鉴定后的目的DNA,可通过穿梭载体从第1个储存宿主转移到表达宿主中,最终产生相关活性物质。

通过剧烈的原位裂解方式所获得的eDNA片段很小(500~5000bp),为避免已被严重剪切的eDNA携带信息的进一步损失,不宜选择限制性酶切反应产生黏性末端与载体连接,采用末端补平或T-A连接的方式能有效解决这一难题。

(3)宏基因组文库的筛选 由于环境基因组的高度复杂性,需要通过高通量和高灵敏度的方法筛选和鉴定文库中的有用基因。筛选技术大致可以分为三类:基于核酸序列的差异分析筛选(序列驱动)、基于克隆子的特殊代谢活性筛选(功能驱动)和基于底物诱导基因的表达筛选。

①序列分析筛选法(sequence-driven screening method):DNA序列分析是发现和认识基因多态性的前提,是现代生命科学研究的核心技术之一。序列分析筛选法是根据已知基因和基因表达产物的保守序列设计引物和探针,通过杂交或PCR扩增筛选阳性克隆。序列分析法可有效地用于鉴定系统发育学中的标志基因(16S rRNA基因等)和带有高度保守域的酶基因。

PCR扩增往往只能实现部分基因的扩增,因此从复杂的环境基因组文库中分离到全长的序列比较困难。整合子-基因盒系统的出现可以克服这一难题。整合子由一个整合酶基因和1个含59bp的重组位点组成,基因盒可以从这个特异的重组位点插入并将这个位点分隔开与之比邻,被分隔开的这些位点常含有25bp的保守序列,以这些保守位点序列作为PCR引物扩增即可获得基因盒中的全长基因。

微阵列技术(microarray)又称基因芯片技术,采用集约化和平面化处理原理,在微小片基上高密度而有序地排列大量基因片段或寡核苷酸片段。利用微阵列技术研究特定环境的微生物,可以了解环境样品中微生物群落结构及其基因表达图谱和新的代谢途径,探测未知基因的功能,追踪具有重要功能的关键基因。但是利用这种方法进行基因检测的灵敏度只有PCR法的1/10000~1/100,其灵敏度和专一性有待于进一步提高。

生物信息学的发展和基因库的不断扩大为基因组测序提供了丰富的资源。鸟枪法测序(shotgun sequencing)、焦磷酸测序(pyrosequencing)、皮升级反应器(picolitre)等新型测序技术的出现,促进了基因组测序的广泛应用。鸟枪法为大规模测序提供了技术保障。该方法首先将一条完整的目标序列随机打断成小的片段,分段测序,然后利用计算机根据序列间的重叠关系进行排序进而重新组装,确定它们在基因组中的正确位置。鸟枪法为筛选新的天然产物提供了一种可选择的途径,挖掘上百万新基因,揭示不可培养微生物的代谢途径。但是,该测序技术同时存在着耗费大、需大量人力物力、难以对环境基因组的巨大序列片段分析等缺点。焦磷酸测序具有高通量、快速等特点;但是测序的基因序列长度有限,比较适合验证只有几十个碱基对的短序列DNA片段,适合进行大样本的快速检测。

②功能性筛选法(function-driven screening method):功能性筛选法以基因表达活性测定为基础,通过建立和优化合适的方法从基因组文库中获得具有特殊功能的克隆。这种方法能够快速鉴定出全新且有开发潜力的活性物质。功能筛选的方法包括两种:(a)基于克隆子的特殊功能进行直接检测。例如,采用含有化学染料和不可溶或发光的酶反应底物的选择性培养基培养,根据克隆子的表型特征进行筛选。这种方法具有较高的灵敏度,能够检测到较少的目标克隆子。(b)基于异源基因的宿主菌株与其突变体在选择性条件下的功能互补生长的特性进行检测。

通过功能性筛选的方法可以快速从多个克隆子中鉴定出全长基因,并获得功能基因的产物。但是,筛选方法必须依赖于功能基因或编码功能蛋白在外源宿主中的表达。由于许多功能基因或基因产物在外源宿主细胞不表达或者表达后没有活性而降低了筛选效率,需要优化筛选方法和选择合适的底物及筛选条件,并建立合适的宿主载体系统,加快新的生物功能产物的挖掘和利用。在许多研究中,大肠杆菌被成功地作为宿主进行基因表达和生物活性物质筛选。近来,其他细菌宿主如链霉菌和假单胞菌也已用于筛选功能克隆子。为了便于聚酮类物质的异源表达,链霉菌也就自然地作为DNA文库筛选的替代宿主,并从重组克隆子中筛选到一系列抗生素

序列分析法和功能性筛选法在环境微生物多样性研究以及新基因挖掘中发挥了重要的作用,而这两种方法各有不足之处。为了更全面地挖掘土壤微生物多样性的组成信息,往往需要把这两种方法结合起来使用。例如,用BAC载体构建了大片段DNA插入基因库,同时利用序列分析和活性测定的方法筛选基因库中新的生物活性物质。

③底物诱导基因表达筛选法(substrate induced gene-expressing screening method,SIGEX):序列分析法和功能筛选法在宏基因组文库的新基因挖掘中起到重要作用,但是这两种方法均存在克隆效率低、操作费时费力等缺陷。底物诱导基因表达筛选法克服了上述缺陷,常被用于功能基因筛选。该方法的基本原理是,相关代谢或酶基因在有底物存在的条件下才表达,反之则不表达。可通过这个原理进行目的代谢基因筛选。这个方法的基本过程分为4步:(a)选择合适的载体构建宏基因组文库;(b)在无底物的情况下以异丙基-D-硫代半乳糖苷(IPTG)为诱导物去除阴性克隆和绿色荧光蛋白基因(gfp)表达的克隆子;(c)在培养基中添加底物诱导代谢相关基因的表达;(d)根据gfp基因的表达从宏基因克隆中筛选出代谢基因表达的克隆子,利用荧光激活细胞分离仪(FACS)从琼脂糖平板上分离GFP表达的克隆子。这个方法为高通量筛选提供了保障,不需要对底物进行修饰;但是不能进入细胞质的底物无法诱导目标基因表达,而且该方法对设备的要求也较高。

(4)宏基因组测序及分析对环境宏基因组文库克隆的高通量测序产生了海量的生态学数据。环境宏基因组文库的高通量测序结果是混杂在一起的,来源于多种不同微生物的序列,必须结合先进的生物信息学方法和新型计算工具才能将各个序列片段精确组装,以准确地归类于它所对应的微生物物种,得到无偏差的群落结构分析结果。尤其对微生物高度丰富的环境样品宏基因组文库进行大量序列分析时颇具难度。近几年,整合微生物基因组(integrated microbial genomes,IMG)数据管理系统的更新、新型数学运算法则及新型MEGAN软件的发明、先进测序技术、多位点序列分型、多基因表达谱预测、DNA改组、SSAKE(short sequence assembly by K-mer search and 3′read extension)等技术的发明,以及统计学方法的应用,为精确分析环境宏基因组文库所包含的海量信息奠定了坚实的技术基础。

3.宏基因组学与其他技术联用

宏因组文库筛选策略的优化是该领域的发展重点。新方法的发明与运用均以提高筛选频率及更充分地发掘文库资源为目的。环境宏基因组学技术是与多种先进技术交叉的综合性现代前沿技术,对于微生物学的发展发挥了极大的推动作用;在世界范围“生物探矿热”中,其本身也在不停地发展与完善,新型技术的发明与应用已经取得了明显的效果。在微生物生态学基础研究领域,应加强不同方法的科学结合,以减少单一研究方法造成的偏差。

(1)与稳定性同位素标记方法联用 稳定性同位素标记技术与分子生物学技术相结合,形成了稳定性同位素探测技术。利用该技术不需要常规培养来研究环境中的功能微生物群落,强化了对不同环境中微生物功能及其参与的特定生物地球化学过程的认识。从宏基因组文库中找到特定的目的基因,需要筛选和测序上万个克隆,工作量较大。利用同位素标记底物对环境微生物进行富集,使参与特定代谢过程的微生物被同位素标记,从而构建一个环境中执行特定代谢功能的微生物宏基因组文库,极大减少了需要筛选的克隆数量。(www.daowen.com)

(2)与荧光原位杂交技术联用FISH技术可以进行样品的原位杂交,应用于环境中特定微生物种群鉴定、数量分析等,是目前分子生物学领域应用较为广泛的方法之一。为了将特定微生物细胞的多态性与放射性物质的吸收量联系起来,通常将微生物放射技术与荧光原位杂交基因多态性特异探针和荧光显微镜联合起来研究环境微生物群落。结合显微技术的发展,环境基因组学将在基因检测、表达和环境变化上提供更微观的世界,用于窥探微生物群落的变化。

(3)与传统分离培养方法联用 根据研究目的,在构建文库前对样品进行预富集培养,提供一个从整体细胞富集到目的基因富集的范围。宏基因组学技术与传统的富集培养方法联用,可以明显提高阳性克隆的比例,是一种从复杂样品中分离大量新型目的基因的高效方法。

(4)与新型微生物培养方法联用 根据宏基因组文库提供的线索,通过新的培养方法,获得具有重要生态功能的未培养微生物,进一步推动微生物地球化学循环的研究,丰富微生物生态学内容。

二、宏转录组学技术

宏基因组学研究极大地扩展了对于环境微生物群落的基因组成、意义以及遗传变异性等方面的知识,但是缺乏对基因活性和功能等方面的信息。宏转录组学技术的出现可以克服宏基因组学的缺陷,有助于了解复杂微生物群落中的代谢和功能等方面的信息。

1.基本原理

宏转录组学是在宏基因组之后兴起的一门新学科,研究特定环境、特定时期群体细胞在某功能状态下转录的所有RNA(包括编码RNA和非编码RNA)的类型及拷贝数,是一门在整体水平上研究细胞基因转录情况及转录调控规律的学科。简言之,宏转录组学是从RNA水平研究基因表达情况,研究整个微生物群落在某一功能状态基因组产生的全部转录物的种类、结构和功能、不同微生物构成的群落及其相互关系。

与宏基因组学相比,宏转录组学研究中存在时间和空间的限定。不同生长时期和生长环境下的同一细胞,基因表达情况是不完全相同的。转录组学的研究是功能基因组学研究的重要手段,从信使RNA的表达模式上鉴定功能相关的基因簇,并在蛋白质水平提供特殊的蛋白积累信息。宏转录组学是一种宏观的整体论方法,改变了以往选定单个基因或少数几个基因的研究模式,将基因组学研究带入一个全新的高速发展时代。宏转录组学技术具有宏基因组学技术的全部优点,而且能将特定条件下的生物群落及其功能联系起来,对群体整体进行各种相关功能的研究。

2.基本操作过程

宏转录组学研究一般包括采集纯化RNA、分离富集mRNA、反转录cDNA、测序及数据分析等几个步骤,其中RNA采集以及数据处理是关键步骤(图7-29)。

图7-29 宏转录组学研究的基本步骤

(1)采集样品RNA及mRNA富集与DNA相比,RNA的稳定性较差,降解速度快,许多mRNA的存在时间都短于1min。RNA酶是导致RNA降解的主要原因,影响RNA提取质量以及cDNA文库的构建。因此,必须采取有效措施防止RNA降解,并尽快完成反转录。

提取的RNA包括rRNA、mRNA等。细胞mRNA的数量较少,仅占总RNA的1%~5%。因此,需要对mRNA进行富集。常用的富集方法包括消减杂交法和核酸外切酶消化法。消减杂交法是将16S rRNA和23S rRNA的探针固定于磁珠上,捕获特定的16S rRNA和23S rRNA,达到去除rRNA从而富集mRNA的目的;外切酶消化法是利用核酸外切酶将带有5′-单磷酸的RNA降解,从而达到富集mRNA的目的。单独使用这两种方法都无法完全去除rRNA,而同时使用会降低mRNA的丰度。

(2)mRNA反转录以mRNA为模板,通过反转录酶催化,在体外反转录合成cDNA。cDNA合成包括第一条DNA链的合成、双链cDNA的合成及cDNA的甲基化等,常用方法有随机引物法和poly dT引物合成法两种。随机引物一般由6~10个碱基组成,引物序列是随机的,可以在随机位置上与mRNA结合。在一条mRNA链上有多个引物结合位点,在多个引物结合位点同时进行反转录,易合成较长的cDNA链。使用随机引物时需要去除总RNA中的rRNA、tRNA等,富集mRNA。因为大多数生物mRNA 3′端有poly A,能够与Oligo dT配对进行反转录。由于具有Poly A尾的RNA数量较少,因而采用含有Oligo dT引物合成的cDNA数量和复杂性较小。

(3)宏转录组测序获得的cDNA可以通过高通量测序技术进行序列测定,也可以不构建cDNA文库直接对mRNA进行测序。从环境样品直接提取mRNA并进行测序分析,可以反映基因是否表达及表达的强度,是功能基因组学研究的重要手段。得益于测序技术的发展,宏转录组学可以在限制时间内,测得少量mRNA序列,对量的要求降低;同时对于相同大小的序列文库有更高的覆盖率

(4)数据获得和分析获得和分析宏转录组数据的方法主要有基于杂交的芯片技术(主要包括cDNA芯片和寡核苷酸芯片)、基于序列分析的基因表达系列分析(serial analysis of gene expression,SAGE)和大规模平行信号测序系统(massively parallel signature sequencing,MPSS)。

①芯片技术:基因芯片技术将已知的DNA序列作为探针,并将探针固定于支持物表面,然后将标记的核酸样品与探针DNA进行杂交,通过检测芯片表面的荧光信号分析杂交模式。芯片种类较多,根据其储存生物信息的类型,分为cDNA芯片和寡核苷酸芯片。cDNA芯片和寡核苷酸芯片均通过碱基互补配对的原理进行杂交,检测目标基因。两者之间的差别在于cDNA芯片固定的探针是cDNA,寡核苷酸芯片固定的探针是特定的DNA寡核苷酸片段。

②基因表达系列分析:SAGE对较短的诊断序列进行标签分离、串联、克隆和测序,广泛用于定量分析和各种状态表达基因的比对,具有灵敏、快速、高丰度、高通量和易于发现未知序列等优点。这项技术的最大优势为在对基因性质不了解的前提下,研究微生物转录变化引起的生物现象,在较短时间内检测微生物表达的所有mRNA,定量分析已知基因及未知基因表达情况,获得微生物转录组学图谱,发现新基因及其功能、作用机制等。但是SAGE技术也具有流程复杂、工作量大、价格昂贵和标签确定困难等缺陷。

③大规模平行信号测序系统:MPSS是对SAGE技术的改进,能够在短时间内检测到微生物群落全部基因表达情况,是功能基因组研究的有效工具。通过对每个基因产生的单个mRNA分子进行计数,分析一个样品全部基因的表达水平。在每个细胞少量mRNA分子的水平上,MPSS具有常规敏感性;并且数据集以数字的形式简化了数据的处理与分析。

三、宏基因组学与宏转录组学的对比

宏基因组学研究的是一个特殊有机体或微生物群落的基因潜力;宏转录组学研究的是在特定环境下被转录的基因亚群,是快速捕获存在于特殊生态位基因的有力工具。宏基因组学描述了研究总基因组DNA的途径及方法,进而揭示微生物群落所包含的代谢潜能。宏基因组文库中的目的克隆筛选主要采用功能筛选和序列筛选的方法,但是这两种方法都存在一定的缺陷。序列筛选法的缺陷主要在于其测定的速度和费用;功能筛选法主要是效率问题。由于存在着基因在转录水平上的剪切修饰等加工过程,从几万或几十万个克隆只能筛选到几个活性基因。因此,基因组DNA的微生物结构分析没有考虑微生物的活力和代谢状态。

在“组学”研究中,宏转录组学是宏基因组学发展的下一个阶段。通过cDNA直接克隆的方法研究环境样品中RNA转录的组成,能够直接检测转录的活性基因,最重要的是聚焦于样品活性群落,降低群落的复杂程度,这是宏转录组学的优势。RNA的表达与细菌的活性直接相关,因此基于RNA的群落分析更能准确地描述微生物群落中的代谢活性成员。宏转录组学旨在研究微生物群落功能基因的表达,为鉴定和分析微生物群落特异性变种的关键基因提供了新方法。与宏基因组分析相比较,宏转录组学只需要对较少量的转录本进行测序。随着第二代、第三代高通量测序技术的发展,宏基因组学和宏转录组学已经广泛应用于海洋、土壤等复杂生态系统的微生物群落的结构分析和功能研究,在发现新基因、微生物群落分析、微生物和环境的相互作用、碳氮等物质循环研究中逐渐成为热点

四、组学技术在微生物生态学研究中的应用

传统的微生物生态学研究依赖于纯培养的方式,根据形态学生理学特征鉴定微生物。但是面对庞大的微生物群体以及观察的主观性,传统的研究技术远远无法满足微生物生态学研究的需求。分子生物学技术为全面深入地了解微生物生态提供了可能。宏基因组学和宏转录组学同样是研究微生物群落结构和功能的重要手段。大规模测序技术促进了生物信息学数据库的发展,更好地应用于大规模微生物基因组和转录组序列的分析。数据库之间相互联系,并借助网络形成复合、开放性的多功能数据库,同时整合多种数据分析软件,为使用者提供了方便。此外,大量基因注释工作极大丰富了数据库,为宏基因组学和宏转录组学技术的发展提供了有利的新途径。

宏基因组学和宏转录组学可以应用于研究微生物与环境、寄主及其他微生物之间的关系,并通过分析宏基因组中不同基因群研究微生物群体中的代谢网络。由于受到测序及分析技术的限制,宏基因组学和宏转录组学技术面临着许多挑战。首先,将两种方法结合使用可以有限监测微生物的基因表达,揭示不同环境中微生物群落结构的关系;但是目前将两种方法结合使用的研究还较少。其次,宏基因组学技术和宏转录组学技术都需要高通量测序技术支撑,对样品的质量和纯度要求较高,因此样品提取是一个关键步骤。针对不同环境的样品探索出能够最大限度提取样品DNA和RNA的方法,提高mRNA的富集程度,是有效发挥组学研究潜力的重要前提。再次,高通量测序技术降低了测序成本、缩短了测序时间、提高了准确度,但是宏基因组和宏转录组测序对测序通量要求更高,需要多达几十万条的序列,成本相对较高。宏转录组学和宏基因组学研究起步较晚,共享数据库还不够完善,限制了深入分析测定数据,因此需要降低测序成本,进一步完善数据库。最后,宏基因组测序DNA来源广泛,不易检测到丰度较低的基因。单细胞基因组测序技术将对未来微生物生态学研究带来新的机遇。单细胞基因组测序技术是近几年迅速发展的技术,通过细胞分选,将难于培养的单细胞从环境样品中分离出来进行基因组测序,可以拼接成完整的基因组序列,解析其代谢功能。这些基因组信息将促进在种群水平上解释生态系统的功能。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈