数据库的检索是利用计算机程序算法将实验测得的肽质量数据与蛋白质序列数据库中的蛋白质的肽质量计算值进行相关性比较分析,从而得出可能蛋白质的概率并将相关性最好的结果排序,这是凝胶分离蛋白质鉴定的最常用手段。
这种检索途径有一个明显的限制,就是被鉴定的蛋白质必须在序列数据库(蛋白质数据库和核酸序列翻译数据库)中存在。PMF检索鉴定蛋白质是依据实验中获得的蛋白质的多个肽段质量数据与同一蛋白质肽段质量理论计算值之间的相关性比较。因此,这一技术不适用于检索EST翻译序列,也不适用于鉴定蛋白质的混合物。而肽序列标签分析(Sequence tag analysis)可适用于检索EST数据库。
主要搜索Swiss Prot(速度快但不全面)和NCBI(速度虽慢但包含更多的信息)数据库。如果认为蛋白质可能为新的蛋白质,选择NCBI数据库,标准搜索选择Swiss Prot 数据为好。也可搜索EST数据库(用MS/MS数据按搜索更有效)。
检索条件的设置与结果判断:
(1)肽片段质量选择在800~4 000 Da范围。
(2)氨基酸残基的修饰(Modifications):半胱氨酸为脲甲基半胱氨酸(Cardamidomethyl-Cys),蛋氨酸选择可变修饰—— 氧化。(www.daowen.com)
(3)最大允许的肽质量误差(Mass Tolerances),与仪器性能和数据质量有关,一般设为±0.1Da,最大为±0.5Da,质量误差越小,搜索的特异性越高。
(4)不完全酶解位点数目(Missed cleavages):每个肽允许有2个不完全裂解位点,一般选1(如果蛋白充分变性且酶解完全)。
(5)参考蛋白质表观分子量和等电点,表观pI误差范围为±0.5pH,表观Mr误差为范围为±20%。一般情况下不选此项,在判读结果时参考。
(6)物种选择:限定物种。
(7)离子选择:M+、H+,单同位素最少匹配肽片段规定为4。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。