对基因组中某个基因通过克隆扩增,获得该基因进行研究或应用,称这种基因为目的基因。
图5-8 以质粒为载体的DNA克隆过程
目的基因是指待研究或待应用的特定基因,也就是需要克隆或表达的基因。在已知目的基因部分核苷酸序列或全部核苷酸序列的情况下,目前获得目的基因的方法主要有以下几种:基因人工化学合成法,基因组文库法、cDNA文库法和PCR法等。
(一)从基因文库中获取目的基因
基因文库包括基因组文库和部分基因文库。将含有某种生物不同基因的许多DNA片段,导入受体菌的群体中储存,各个受体菌分别含有这种生物的不同的基因,称为基因文库(图5-9)。如果这个文库包含了某种生物的所有基因,那么,这种基因文库叫做基因组文库(genomic library或gene bank)。如果这个文库只包含了某种生物的一部分基因,这种基因文库叫做部分基因文库,例如cDNA文库,首先得到mRNA,再反转录得cDNA,形成文库。cDNA文库与基因组文库的区别在于cDNA文库在mRNA拼接过程中已经除去了内含子等成分,便于DNA重组时直接使用。
图5-9 基因文库
基因组文库法是一种直接从基因组中分离目的基因的方法。直接从组织或细胞中提取大分子量DNA,用合适的限制性内切酶将DNA消化成许多片段,将所有的DNA片段都与载体连接,并引入宿主细胞进行扩增,得到含有所有的DNA克隆的混合体,即基因组文库。在这个文库中,不同的细菌所携带的重组DNA分子可能为不同的基因组DNA片段,经过筛选、鉴定,即可找到我们感兴趣的目的基因。理想的基因组文库中所有克隆的DNA片段的总和应为整个基因组DNA序列的2~3倍,克隆与克隆之间应有重叠序列,以保证从文库中筛选得到完整的基因。
用重组DNA技术将某种生物细胞的总DNA或染色体DNA的所有片段随机地连接到基因载体上,然后转移到适当的宿主细胞中,通过细胞增殖而构成各个片段的无性繁殖系(克隆),在制备的克隆数目多到可以把某种生物的全部基因都包含在内的情况下,这一组克隆的总体就被称为某种生物的基因文库。同一定义也适用于某种生物的线粒体DNA或叶绿体DNA的基因文库。由于制备DNA片段的切点是随机的,所以每一克隆内所含的DNA片段既可能是一个或几个基因,也可能是一个基因的一部分或除完整基因外还包含着两侧的邻近DNA序列。
一个基因文库中应包含的克隆数目与该生物的基因组的大小和被克隆DNA片段的长度有关。原核生物的基因组较小,需要的克隆数也较少;真核生物的基因组较大,克隆数需相应增加,才能包含所有的基因。此外,每一载体DNA中所允许插入的外源DNA片段的长度较大,则所需总克隆数越少;反之则所需数越多。如果一个基因文库的总克隆数较少,则从中筛选基因虽然比较容易,但给以后的分析造成困难,因为片段的长度增加了。如果要使每一克隆中的DNA片段缩短,就须增加克隆数,所以在建立基因文库前应根据研究目的来确定DNA片段的长度和克隆的数目。L.克拉克和J.卡邦在1975年提出过一个统计学的公式来计算某一基因文库中所应包含的克隆数目。在建立基因文库时,任何一个DNA片段都是在随机的基础上被克隆的。基因文库中每一克隆所含外源DNA片段的平均长度,可根据该生物基因组大小和所用载体可容纳的外源DNA片段的长度决定。
产生DNA片段的方法要求切点随机性高,使任一基因都可能被完整地克隆,并且最好在两侧都留有黏性末端以利于DNA片段间的连接。机械剪切方法的优点是随机性高,可是所得片段两端没有黏性末端,有时较为不便与载体连接。用限制性核酸内切酶酶解的随机性较差,但是两端有黏性末端,便于和载体相连接。
可用核酸分子杂交的方法从基因组文库中筛选含有目的基因的克隆。可用于构建高等真核生物染色体基因组文库的载体有λ噬菌体,柯斯质粒和酵母人工染色体等。将这些载体导入到受体细菌或细胞中,这样每个细胞就包含了一个基因组DNA片段与载体重组DNA分子,经过繁殖扩增,许多细胞一起包含了该生物的全部基因组序列,这一个集合体即基因组文库。
高等真核生物染色体基因组文库通常是以λ噬菌体作为载体构建的,有时也可以柯斯质粒作为载体构建。利用λ噬菌体载体构建基因组文库的一般操作程序如下:①选用识别序列均为4个核苷酸的两种限制性内切核酸酶,对从某一高等真核生物组织细胞中提取的染色体基因组DNA进行部分酶解,得到10~30 kb的DNA限制性片段,利用凝胶电泳法等从中分离出大小为20 kb左右的随机片段群体。②选用适当的限制性内切核酸酶酶解λ噬菌体载体DNA。③经适当处理,将基因组DNA限制性片段与λ噬菌体载体进行体外重组。④利用体外包装系统将重组体包装成完整的颗粒。⑤以重组噬菌体颗粒侵染大肠杆菌,形成大量噬菌斑,从而形成含有整个DNA的重组DNA群体,即基因文库。
为了有效地保存基因文库,可通过细菌的繁殖而使包含各个特定DNA片段的细菌增多。液体培养不适用于这一目的,因为各个细菌的生存和繁殖能力不同,各个克隆被保存的机会也会因此而不相等。在固体培养基上每一个细菌单独形成一个菌落,各个细菌并不相互干扰和竞争,因而有利于全部克隆的保存。形成的每一个菌落中大约包含1000万个细菌,这样一个基因文库中的所有的克隆几乎都扩增了1000万倍。把培养皿上的细菌全部洗下加以保存,便可以在需要时从中取得任何一个克隆。
建立和使用基因文库是分离基因,特别是分离高等真核生物基因的有效手段。如果一个哺乳动物的基因组是3×109碱基对,直接从细胞中提取并分离出某一特定基因的DNA片段在技术上是很困难的。但是在基因文库中,不同的DNA片段都分别在不同的克隆中扩增了,只要有该基因的探针存在,则从许多克隆中筛选一个所需的克隆是一项比较简单的工作。此外基因文库中被克隆的DNA都是基因组中各种随机的顺序片段,某些DNA片段还包括基因外部的邻近的甚至互相跨叠的序列,所以基因文库特别有利于研究天然状态下基因的顺序组织。例如曾从人的基因文库中分离得到含有血红蛋白β链基因的克隆,从中取得该基因的DNA并进行分析,发现人的δ和β链基因是连锁的,二者之间相隔几千个碱基对,而且在它们内部都有两个内含子。
具备了文库,就可以适当的目的基因片段作探针,利用高密度的噬菌斑或菌落原位杂交技术,从大量的噬菌斑或菌落中筛选出含有目的基因的重组体的噬菌斑或菌落,再经过扩增提取其中的重组体,最后即可获得所需要的目的基因片段。基因文库还可以应用在个体发育的研究中。例如从芽孢杆菌正在形成芽孢的菌体中分离mRNA,并用同位素标记做成探针,用这些探针可以从芽孢杆菌的基因文库中分离出只在芽孢形成过程中活动的基因,有助于对发育过程中的基因调控进行研究。基因文库也可以应用在高等生物,例如人的基因定位工作中。基因文库在生产实际中也是取得所需要的基因的一种重要方法。
(二)人工化学合成法获取目的基因
如果已知目的基因的核苷酸序列,可以用人工合成的方法获得。一些分子量很小的多肽,也可以根据其氨基酸序列,按照对应的密码子推导出DNA序列(图5-10),然后用化学合成方法合成。对于较大的基因,可以分段合成DNA短片段,再经过DNA连接酶作用依次连接成一个完整的基因。采用人工合成的方式已经得到人胰岛素基因和生长激素释放抑制因子基因等,并在大肠杆菌内成功表达。但是,这种方法的成本很高,尤其是大片段DNA的合成。
图5-10 氨基酸序列推测DNA序列
目前,化学合成基因的思路主要有两条:①全基因合成,一般适于分子较小而不易获得的基因。首先根据双链基因序列,合成长度为40~60个碱基的寡核苷酸单链片段,并使每对相邻互补的片段之间有4~6个碱基交叉重叠,然后将除基因两个末端外的所有片段磷酸化,在混合复性后加入DNA连接酶,即可获得较大的基因片段。如果需连接的DNA片段较多,可采用分步连接及克隆的方法,最后将较大的片段重组为完整的基因。②基因的半合成,一般适于分子较大的基因。首先合成末端有10~14个互补碱基的寡核苷酸单链片段,复性后以重叠区为引物,利用DNA聚合酶I大片段或逆转录酶等催化合成反应,即可获得两条完整的互补双键DNA。
基因的化学合成法主要用于PCR扩增引物、核酸测序引物、核酸杂交探针和合成接头等富核苷酸片段的合成。
就化学本质而言,基因是一段具有特定生物功能的核苷酸序列。如果知道了基因的分子结构,就可以进行基因的化学合成。有关DNA的化学合成方法主要有磷酸二酯法、磷酸三酯法、亚磷酸三酯法、亚磷酸酰胺法及固相亚磷酸酰胺法。磷酸二酯法是最初发明的化学合成基因的方法,而固相亚磷酸酰胺法是目前绝大部分DNA自动合成仪所使用的方法。由于现代科学技术的发展,DNA的化学合成已经广泛采用DNA自动合成仪进行,因此现在仅在少数特殊情况下,采用人工合成。目前,一般DNA合成都采用固相亚磷酸酰胺三酯法合成DNA片段,此方法具有高效、快速偶联以及起始反应物稳定等优点,已在DNA化学合成中广泛使用。DNA化学合成不同于酶促的DNA合成过程从5′→3′方向延伸,合成的方向是由待合成引物的3′-端向5′-端合成的,相邻的核苷酸通过3′,5′磷酸二酯键连接,具体反应步骤如下:
①脱保护基(Deblocking):用三氯乙酸(Trichloroacetic Acid,TCA)脱去预先连结在固相载体CPG(Controlled Pore Glass)上的核苷酸的保护基团DMT(二甲氧基三苯甲基),获得游离的5′-羟基端,以供下一步缩合反应。
②活化(Activation):将亚磷酸酰胺保护的核苷酸单体与四氮唑活化剂混合并进入合成柱,形成亚磷酸酰胺四唑活性中间体(其3′-端已被活化,但5′-端仍受DMT保护),此中间体将与CPG上的已脱保护基的核苷酸发生缩合反应。
③连接(Coupling):亚磷酸酰胺四唑活性中间体遇到CPG上已脱保护基的核苷酸时,将与其5′-羟基发生亲和反应,缩合并脱去四唑,此时合成的寡核苷酸链向前延长一个碱基。
④封闭(Capping):缩合反应后为了防止连在CPG上的未参与反应的5′-羟基在随后的循环反应中被延伸,常通过乙酰化来封闭此端羟基,一般乙酰化试剂是用乙酸酐和N-甲基咪唑等混合形成的。
⑤氧化(Oxidation):缩合反应时核苷酸单体是通过亚磷酸键与连在CPG上的寡核苷酸(oligo)连接,而亚磷酸键不稳定,易被酸、碱水解,此时常用碘的四氢呋喃溶液将亚磷酰转化为磷酸三酯,得到稳定的寡核苷酸。
经过以上五个步骤后,一个脱氧核苷酸就被连到CPG的核苷酸上,同样再用三氯乙酸脱去新连上的脱氧核苷酸5′-羟基上的保护基团DMT后,重复以上的活化、连接、封闭、氧化过程即可得到一DNA片段粗品。最后对其进行切割、脱保护基(一般对A、C碱基采用苯甲酰基保护;G碱基用异丁酰基保护;T碱基不必保护;亚磷酸用腈乙基保护)、纯化(常用的有HAP,PAGE,HPLC,C18,OPC等方法)、定量等合成后处理即可得到符合实验要求的寡核苷酸片段。
固相合成寡核苷酸是在DNA合成仪上进行的,上述方法合成的寡核苷酸在脱去保护基后,目的寡核苷酸纯度是极低的,含有大量的杂质,主要杂质有脱下的保护基与氨形成的苯甲酸氨和异丁酸氨,腈磷基上脱下的腈乙基以及合成时产生的短链等,以至于粗产品中寡核苷酸含量仅为15%左右。尽管合成时每一步的效率都在97%~98%,但累积的效率并不高。以链长20mer和50mer为例,(97.5%)20≈60%、(97.5%)50≈28%,可见在粗产品中目的Oligo含量很低,甚至10%都不到。这些杂质,尤其是存在于粗产品中的大量盐和短链,不但造成定量不准,而且影响下一步的反应,因此必须对寡核苷酸进行纯化。建议采用聚丙烯酰胺凝胶电泳(PAGE)纯化,该方法纯化的产品纯度高,可用于绝大部分的分子生物学实验,可避免许多意想不到的麻烦。若考虑节约经费,对于要求较低的实验,如简单的PCR反应,则采用脱盐纯化即可。寡核苷酸DNA是以OD260值来计量的。在1mL的1cm光程标准石英比色皿中,260nm波长下吸光度为1的Oligo溶液定义为1 OD260。虽然对于每种特定的寡核苷酸来说,其碱基的组成不尽相同,但1 OD260 Oligo DNA的重量约为33mg,每个碱基的平均分子量约为330Da。
(三)利用PCR合成DNA
PCR(Polymerase Chain Reaction,多聚酶链式反应)技术是1985年由美国Cetus公司开发的专利技术,它能快速、简便地在体外扩增特定的DNA片段,具有高度的专一性和灵敏度。PCR技术是一种在体外对已知基因进行特异性扩增的方法。此法要求对目的基因片段两侧的序列已知,依据已知区域设计特定的DNA引物,在热稳定DNA聚合酶(如Taq酶)催化下,将DNA经反复变性、退火和延长进行循环式合成。在很短的时间里,仅有几个拷贝的基因就可以合成数百万个拷贝。图5-11简单概括了PCR的基本工作原理。根据已知基因的DNA序列设计引物,利用基因组DNA或cDNA为模板,用PCR技术可以直接获取目的基因。详见PCR技术章节,在此,不再赘述。
(www.daowen.com)
图5-11 PCR反应的基本原理
(四)cDNA文库法获取目的基因
虽然可用基因组文库法来获取真核生物的目的基因,但是由于高等真核生物基因组DNA 文库比其cDNA文库大得多,相关工作量同样大得多。更为重要的是,在真核生物基因组中有大量的间隔序列或内含子,但在大肠杆菌等原核生物中尚未发现类似序列存在,大肠杆菌不能从真核生物基因的初级转录本中去除间隔序列,即不能表达真核生物DNA。而在真核生物成熟mRNA中已不存在间隔序列(已在拼接过程中被去除),以真核生物成熟mRNA为模板,逆转录而成的cDNA可被大肠杆菌表达。因此,在基因工程中,cDNA文库法是从真核生物细胞中分离目的基因的常用方法。
图5-12 逆转录合成cDNA的基本过程
以从细胞或组织中提取的总mRNA为模板,利用逆转录酶合成与其互补的cDNA,再复制成双链cDNA片段,然后与适当载体连接,转入受体菌扩增后,即可得到cDNA文库(cDNA library)(图5-12)。cDNA文库应包含某种细胞或组织在特定条件下的全部cDNA克隆,因此从中可以筛选我们感兴趣的cDNA片段。近年来将反转录反应和PCR反应联合应用,利用已知基因的DNA序列设计引物,可以从mRNA中直接获得某种特定cDNA,而不用筛选cDNA文库。
具有与真核生物成熟mRNA(信使RNA)链互补的碱基序列的单链DNA,即互补DNA(complementary DNA),或此DNA链与具有与之互补的碱基序列的DNA链所形成的DNA双链。与RNA链互补的单链DNA,以其RNA为模板,在适当引物的存在下,由依赖RNA的DNA聚合酶(逆转录酶)的作用而合成,并且在合成单链cDNA后,在用碱处理除去与其对应的RNA以后,以单链cDNA为模板,由依赖DNA的DNA聚合酶或依赖RNA的DNA聚合酶的作用合成双链cDNA。真核生物的信使RNA或其他RNA的cDNA,在遗传工程方面广为应用。在这种情况下,由mRNA逆转录合成的cDNA,与原来基因的DNA(基因组DNA,genomic DNA)不同而无内含子;相反地,对应于在原来基因中没有的而在mRNA存在的3′-末端的多A序列等的核苷酸序列上,与exon序列、先导序列以及后续序列等一起反映出mRNA结构。
所谓cDNA文库,是指汇集以某生物成熟mRNA为模板逆转录而成的cDNA序列的重组DNA群体。cDNA文库通常以λ噬菌体和质粒作为载体构建。构建cDNA文库的一般操作程序如下:
1.构建cDNA文库 以生物细胞的总mRNA为模板,用反转录酶合成互补的双链cDNA,然后接到载体上,转入到宿主后建立的基因文库就是cDNA文库。
(1)mRNA的提取及其完整性的确定
1)总RNA的提取:从细胞中提取RNA与提取DNA的方法基本相同,可以用APGC法或应用试剂盒提取总RNA。但是,由于RNA极易被RNA酶降解,因此在分离RNA时,抑制RNA酶的活性特别重要。常用的RNA酶的抑制剂有异硫氰酸胍、盐酸胍、二乙基焦碳酸(DEPC)等。
图5-13 纤维柱分离纯化mRNA
2)mRNA的分离:高等真核生物mRNA一般为其总RNA的1%~5%,每种特异mRNA的量非常少。因此,要提取特异mRNA,就需要选择特异而高度分化的组织。在这些组织细胞中特异mRNA所占的比例较大。真核细胞mRNA的3′-端一般带有poly(A)尾序列,这一重要特性常被用于从总RNA中分离带poly(A)的mRNA,将总RNA通过寡聚(DT)纤维柱分离mRNA或利用磁珠法制备纯mRNA(图5-13)。在某些情况下,裂解细胞后用蔗糖梯度来制备mRNA-核糖体复合物作为提取mRNA的替换途径。
3)mRNA的纯化:①按照大小对总mRNA进行分级,主要用琼脂糖凝胶电泳和蔗糖密度梯度离心法进行分级;②多聚核糖体的免疫学纯化法,这是利用抗体来纯化合成目的多肽的方法。
4)mRNA完整性的确定:确定mRNA完整性的方法有三种:①直接检测mRNA分子的大小;②测定mRNA的转译能力;③检测总mRNA指导合成cDNA第一链长分子的能力。
5)噬菌体的包装及转染或质粒的转化:形成大量噬菌斑或菌落,从而形成以某生物成熟mRNA为模板逆转录而成的cDNA序列的重组DNA群体即cDNA文库。
同样,具备了cDNA文库,就可以适当的目的基因片段作探针,利用高密度的噬菌斑或菌落原位杂交技术,从大量的噬菌斑或菌落中筛选出含有目的基因的重组体的噬菌斑或菌落,再经过扩增,提取其中的重组体。最后即可获得所需要的目的基因片段。
目前采用cDNA克隆技术已经分离了许多与园艺产品采后生理相关的基因,如在番茄cDNA文库中建立了146个与成熟相关的基因,得到了与果实硬度有关的PG基因,与乙烯生物合成有关的ACC合成酶基因、ACC氧化酶基因等。
(2)cDNA的合成和克隆
1)cDNA第一链的合成:用亲和层析法得到纯化mRNA后,根据mRNA分子的3′-端有poly(A)尾结构的原理,以poly(A)mRNA为模板,用12~20个核苷酸长的oligo(dT)与纯化的mRNA混合,oligo(dT)会与poly(A)结合作为逆转录酶的引物,逆转录反应的产物是一条RNA-DNA的杂交链。oligo(dT)结合在mRNA的3′-端,因此合成全长的cDNA需要反转录酶从mRNA分子的一端移动到另一端,有时这种全合成难以达到,尤其是mRNA链很长时,为此建立了一种随机引物法合成cDNA。随机引物是一种长度为6~10个核苷酸,由4种碱基随机组成的DNA片段。与oligo(dT)仅与mRNA的3′-端结合不同,它们可以在mRNA的不同位点结合。随机引物法合成的产物也是RNA-DNA的杂交体。把cDNA克隆到载体中之前,必须把这种杂交体中的RNA转变成DNA链,即形成双链DNA分子。
2)双链cDNA的合成:合成cDNA第二条链有下列几种方法。
①自我引导合成:利用cDNA第一链的3′-末端常常出现发夹环的特征,这种发夹结构是反转录酶在第一链末端“返折”并且复制第一链的结果,它为合成cDNA第二链提供了有用的引物。用这种方法合成的双链cDNA在一端有一个发夹环,可以用特异切除单链的S1核酸酶切去发夹环部分,最终得到平端双链cDNA。但是S1核酸酶的处理,常常会“修剪”过多的cDNA顺序,使cDNA丢失了mRNA 5′-端的部分序列。因此现在已较少采用这种方法合成cDNA第二条链。
②置换合成:用大肠杆菌的RNase H进行修饰。RNase H能识别RNA-DNA杂交分子并把其中的RNA切割成短的片段,这些RNA短片段仍与cDNA第一链结合,可被新合成的DNA所取代。新合成的DNA存在切口,用DNA连接酶把这些切口连接在一起形成一条完整的DNA链。使用RNase H法合成cDNA第二条链,实际效果要优于S1核酸酶法,因为它能获得包含mRNA 5′-端全部或绝大部分的更长顺序cDNA分子。
③同聚物加尾法:如果连接的两个DNA片段没有能互补的黏性末端,可用末端核苷酸转移酶催化脱氧单核苷酸添加DNA的3′-末端,例如一股DNA的3′-端加上polyA,另一股DNA加上polyT,这样人工在DNA两端做出能互补的共核苷酸多聚物黏性末端,退火后能连接(图5-14),这种方法称为同聚物加尾法。当混合物中只有一种dNTP时,就可以形成仅由一种核苷酸组成的3′-尾巴。我们特称这种尾巴为同聚物尾巴(homopolymeric tail)。
图5-14 同聚物加尾法
这种方法的核心部分是,利用末端脱氧核苷酸转移酶转移核苷酸的特殊功能。末端脱氧核苷酸转移酶是从动物组织中分离出来的一种异常的DNA聚合酶,它能够将核苷酸(通过脱氧核苷三磷酸前体)加到DNA分子单链延伸末端的3′-OH基团上。由核酸外切酶处理过的DNA,以及dATP和末端脱氧核苷酸转移酶组成的反应混合物中,DNA分子的3′-OH末端将会出现单纯由腺嘌呤核苷酸组成的DNA单链延伸。这样的延伸片段,称之为poly(dA)尾巴。反过来,如果在反应混合物中加入的是dTTP,那么DNA分子的3′-OH末端将会形成poly(dT)尾巴。因此任何两条DNA分子,只要分别获得poly(dA)和poly(dT)尾巴,就会彼此连接起来。
同聚物加尾法的优点:首先不易自身环化;因为载体和外源片段的末端是互补的黏性末端,所以连接效率较高;用任何一种方法制备的DNA都可以用这种方法进行连接。缺点:方法繁琐;外源片段难以回收;由于添加了许多同聚物的尾巴,可能会影响外源基因的表达;重组连接后往往会产生某种限制性内切核酸酶的切点。
需要指出的是,逆转录能否形成全长cDNA,取决于转录中所取的条件、模板的结构和纯度。为了获得全长cDNA,并提高其在总cDNA中的比例,需要注意:提高底物dNTP的浓度,或加入一定量的焦磷酸钠等;加入氢氧化甲基汞或解链蛋白,以打开mRNA的二级结构,使逆转录酶易于穿越mRNA的特异性区域;加入RNase抑制剂,以防止污染的RNase对模板的降解作用;在合成cDNA第二链时,采用无5′→3′外切核酸酶活性的大肠杆菌聚合酶I的Klenow片段,而不是全酶。
(3)双链cDNA与载体的连接:合成的双链cDNA与载体DNA进行连接构成重组体一般有3种方法:①借助于末端转移酶的3′-OH端合成均聚物的能力,双链cDNA和线性化载体DNA的3′-OH端分别加上均聚核苷酸链;②双链cDNA和线性化载体DNA分别用Klenow片段进行末端补平,然后用T4 DNA连接酶进行齐头连接,形成重组体;③通过黏性末端连接。
下图简单说明基因组文库与cDNA文库的区别(图5-15)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。