理论教育 设计全新蛋白质:酶学与酶工程原理

设计全新蛋白质:酶学与酶工程原理

时间:2023-11-18 理论教育 版权反馈
【摘要】:设计全新蛋白质指的是从氨基酸一级结构开始,从头设计一个自然界不存在的新酶,使之达到预期的空间结构和生化功能。在蛋白质功能设计方面主要是进行天然蛋白质功能的模拟,如金属结合蛋白和离子通道等。设计的蛋白质序列只有合成并经过结构检测后才能判断设计的结构是否与预想的结构相符合。一般从以下三个方面进行检测:设计的蛋白质是否为多聚体;二级结构含量是否与目标相符合;是否具有预定的三级结构。

设计全新蛋白质:酶学与酶工程原理

设计全新蛋白质(de novo design)指的是从氨基酸一级结构开始,从头设计一个自然界不存在的新酶,使之达到预期的空间结构和生化功能。蛋白质的全新设计可以分为功能设计结构设计两个方向,目前的重点和难点是结构设计。结构设计是从最简单的二级结构开始的,以摸索蛋白质结构稳定的规律。在超二级结构和三级结构的设计中,一般选择天然蛋白质结构中一些比较稳定的模块进行设计,如四螺旋束和锌指结构等。在蛋白质功能设计方面主要是进行天然蛋白质功能的模拟,如金属结合蛋白和离子通道等。蛋白质设计原理基于以下几个假设:①蛋白质内部存在一个由氢键连接的二级结构单元组成保守内核;②蛋白质内部都是由疏水氨基酸残基密堆积的实心体,并且没有重叠;③所有内部主链及侧链上的氢键都是饱和的;④亲水基团需要合理地分布在溶剂可及表面;⑤在金属蛋白质中,配位残基的替换要满足金属配位几何,大多数配基含有多于一个与金属作用或形成氢键的基团,其余形成围绕金属中心的氢键网络。

设计全新蛋白质的步骤一般从酶的活性中心开始,该部分是酶发挥催化作用的核心部分,因此全新设计方法首先需要根据催化机制的需要设计过渡态催化模型,并在此基础上设计好需要的催化氨基酸残基及其空间排布。接下来需要把这个活性中心镶嵌入一个可以稳定折叠的蛋白质骨架中,新酶在溶液状态下具有适当的刚性和柔性,来确保催化反应的进行,这一步骤是酶全新设计的难点所在。从热力学角度考虑,酶结构全新设计需要尽量使氨基酸残基相互作用的强度和数目达到最大,使其吸纳的能量超过构象熵,有时候甚至需要插入一些半胱氨酸形成共价的二硫键来稳定酶的结构并减少阻碍折叠的构象熵。

蛋白质全新设计的一般过程可用图7-16表示。确定设计目标后,先根据一定的规则生成初始序列,经过结构预测和构建模型对序列进行初步的修改。然后进行多肽合成或基因表达,最后经过结构检测确定是否与目标相符合,并根据检测结果指导进一步的设计。蛋白质设计一般都要经过反复多次的设计→合成→检测→再设计的过程。

图7-16 蛋白质全新设计的过程

(一)二级结构的设计

α-螺旋的设计一般遵循以下原则:选择形成α-螺旋倾向性比较大的氨基酸残基,如亮氨酸、谷氨酸、丙氨酸和甲硫氨酸等;在设计两亲性α-螺旋时,疏水氨基酸应该按3或4的间隔排列以使结构中形成一个亲水面和一个疏水面;α-螺旋中所有的氢键指向同一方向,沿螺旋轴积累总的效果形成一个由N端指向C端的偶极矩,因此再设计α-螺旋时,尝试使带正电的氨基酸残基靠近C端,带负电的氨基酸残基靠近N端;由于α-螺旋的两端各有3个残基的氢键能力未能得到全部满足,为稳定α-螺旋,常常需要在其两端各加一个N帽和C帽。

β-折叠结构中氢键在不同的β-折叠股间形成,也就是说,β-折叠片的形成与序列的“上下文”的关系更密切。另外,单个氨基酸残基平均形成的氢键数目较α-螺旋少,因而结构稳定性差,所以β-折叠股的设计比α-螺旋的设计困难。单个β-折叠结构不能稳定存在,但可以将其固定在一个模板上来研究其形成规律。根据模型肽和全β结构与α/β结构蛋白质设计的经验,β-折叠片的设计原则主要是选择形成β-折叠片倾向性较大的氨基酸残基(如缬氨酸、异亮氨酸)和使亲水性残基和疏水性残基相间排列。

β-转角是连接蛋白质中不同二级结构的常见单元,对维持各种二级结构的相对位置和稳定蛋白质的三级结构起着重要的作用。β-转角种类很多,不同类型的转角对每个位置的氨基酸残基的二面角有一定的要求,而这些二面角决定了连接的两个二级结构的空间关系,所以转角设计的关键是选择合适的转角类型。某些氨基酸残基对蛋白质的二级结构有终止作用,如Pro和Gly是α-螺旋的中断者,Glu是β-折叠的中断者,因而设计时可利用这些氨基酸残基来终止和分隔不同的二级结构。

(二)超二级结构和三级结构的设计(www.daowen.com)

超二级结构和三级结构的设计,一般首先根据氨基酸形成的二级结构的倾向性选择各二级结构片段的氨基酸残基,此外最重要的一点就是考虑疏水中心的形成。α-螺旋的无规卷曲结构是很多跨膜蛋白的一个重要的结构特征,也是目前研究较多的超二级结构。其序列有一个明显的特征,即存在一个周期性的重复七肽,称为heptad repeat,序列可用abcdefg来表示。其中a和d的位置处于螺旋间的界面,因而在设计时应选择疏水性氨基酸残基,而其他位置为暴露的表面,应选择亲水的氨基酸残基。

β-发卡是另一种常见的超二级结构。β-发卡的形成被认为在β-折叠片的形成中起着形核的作用。因此,如能合成β-发卡的模型肽,就可以研究β-折叠片中各种结构稳定因素。β-发卡设计的一个关键部分就是其中β-转角的设计,尤其是选择合适的转角类型。

三级结构的设计同样也是模仿天然蛋白质中较稳定的结构模块,现在已经有多个比较成功的事例,如Richardson夫妇设计的全β蛋白质betabellin,Coraj等设计的octarellin即(α/β8。由于三级结构的设计难度较大,常需要引入二硫键或者金属离子使其结构更加稳定。

设计的蛋白质序列只有合成并经过结构检测后才能判断设计的结构是否与预想的结构相符合。一般从以下三个方面进行检测:设计的蛋白质是否为多聚体;二级结构含量是否与目标相符合;是否具有预定的三级结构。测定分子体积的方法(如体积排阻色谱法)可以判断分子是否以多聚体的形式存在,同时还可以初步判断蛋白质结构是无规卷曲还是有一定的三级结构。检测蛋白质的浓度对圆二色光谱(CD)和核磁共振谱(NMR)的影响也可以判断蛋白质是否以单分子的形式存在。圆二色光谱是检测设计蛋白质结构最常用的方法,根据远紫外圆二色光谱可以计算蛋白质中各二级结构的大致含量,三级结构测定的方法主要是依靠核磁共振技术和荧光分析。

中心法则告诉我们,蛋白质的序列决定其结构,蛋白质结构又决定其功能。从蛋白质功能倒推蛋白质的序列,则是对中心法则的逆转应用,但是由于对于蛋白质序列决定蛋白质结构的具体细节目前研究得不是很清楚,这样的倒推法并不能完全很好地开展。从最简单的方式——穷举法开始,理论上可以逐个测试所有的可能性。但是即使对于一条由100个残基组成的肽链,每个位置都可能由20个天然氨基酸中的一种组成,其一级结构总共就有20100(大于10130)种可能性,这在现实的实验室是不可能完成的。为了解决这一困难,美国科学院院士大卫·贝克(David Baker)建立了一种名为Rosetta的众包性的蛋白质结构算法,可以让人们将闲置的计算机用于需要进行的计算,从而研究所有潜在的蛋白质折叠。为了吸引公众对科学的兴趣,他还添加了一个称作Foldit的视频游戏外延,可以让偏远用户的独特蛋白质折叠观点指导Rosetta的计算。该计算方法从天然蛋白质结构数据库寻找可以紧密结合过渡态并保持功能基团的空间位置的蛋白质支架,并以此为基础进行优化,再根据过渡态的能量和位置取向对优化后的结果进行筛选,最后通过实验对从头设计的酶的活力进行鉴定(图7-17)。

图7-17 Rosetta算法对于蛋白质结构的预测

美国华盛顿大学教授David Baker发出的Rosetta算法可以基于蛋白质的一级序列预测其空间结构,其中(1)~(7)中左边的都是Rosetta预测模型,右边的分别是:(1)中细胞色素bd氧化酶,(2)中脂蛋白信号肽酶Ⅱ,(3)中DMT超家族转运蛋白YddG,(4)中氟离子转运蛋白二聚体,(5)中CASP11目标蛋白T0806,(6)中前脂蛋白二脂酰基甘油转移酶,(7)中延胡索酸水合酶单体(上)和二聚体(下)。

酶分子的从头设计是一个极具挑战性和富于价值的研究领域,需要在蛋白质折叠理论和实验之间进行多轮的循环并循序渐进。全新设计酶使我们有可能得到自然界中不存在的具有全新结构和功能的酶,它已经成为检验蛋白质折叠理论和研究蛋白质折叠规律的重要手段。随着人们对蛋白质折叠规律的理解不断深入及蛋白质设计经验的积累,必能够大大缩短设计周期,使得全新设计酶的速度和效率得到极大的提高,该方法有望最大限度地挖掘和开发新型酶。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈