EC-PDB(enzyme structures database)包含了所有提交到PDB的酶的结构信息(http://www.ebi.ac.uk/thornton-srv/databases/enzymes/),目前共计有69369条酶结构信息(其中部分酶有多条结构信息,如酶与底物复合物结构等;截至2018年4月)。其中以水解酶最多,其次是转移酶和氧化还原酶(表2-2)。
蛋白质数据库是一个关于大型生物分子三维结构的信息库,包括蛋白质和核酸。了解生物大分子的形状可以推断出结构在人类健康和疾病中的作用,以及药物的发展方向。数据库中的结构范围包括从微小的蛋白质和DNA片段到像核糖体这样的复杂分子。PDB数据库是一个关于原子坐标和其他描述蛋白质与其他重要生物大分子的信息仓库。结构生物学家使用X射线晶体学、核磁共振光谱和冷冻电镜等方法来确定分子中每个原子相对原子的位置。然后,他们将这些信息存储在文档中,将这些信息公开地发布到归档中。大多数情况下,这些实验信息并不足以从头构建一个原子模型,必须增加关于分子结构的知识,例如通常已经知道的氨基酸序列、典型蛋白质中原子的首选几何形状(如键长和键角等)。这需要科学家建立一个模型,与实验数据、分子的预期组成和几何结构相一致。PDB库中的结构是用实验观察和基于已有科学知识的建模来确定的,需要确认一个特定结构的实验证据支持模型,以及基于模型的科学结论。
在PDB数据库的具体使用过程中,通常遵循以下顺序:①根据蛋白质序列信息比对找出同源性最高的已报道蛋白质结构;②在PDB数据库中搜索出该蛋白质结构并下载;③采用Pymol等生物信息学相关软件进行结构分析;④获得预期的结构或其他信息。(www.daowen.com)
【应用实例】一个糖苷水解酶(glycoside hydrolase,GH)17家族β-1,3-葡萄糖基转移酶结构信息的获取。
首先,通过蛋白质序列比对发现一个GH 17家族β-1,3-葡萄糖基转移酶结构。PDB号为:4WTR。进入PDB数据库网站(http://www.rcsb.org/pdb/static.do?p=general_information/about_pdb/index.html),输入PDB号4WTR,点击目标数据后会呈现出该结构的信息,将该结构的pdb文件下载下来,用pymol软件打开,如图2-4所示,即可用于该结构的比较分析。
图2-4 GH 17家族β-1,3-葡萄糖基转移酶(PDB:4WTR)结构分析示意图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。