理论教育 NCBI分子数据库的应用

NCBI分子数据库的应用

时间:2023-11-18 理论教育 版权反馈
【摘要】:(一)数据库页面NCBI分子数据库如图13-6所示。记录显示样本状态,有关馆藏的机构的信息,以及NCBI中相关数据链接。NCBI的GenBank数据库和日本DNA数据库,欧洲分子生物学实验室每天交换数据,保证数据实时跟新。GenBank由几个部分组成,大部分序列可以通过Nucleotide数据库访问。Journals in NCBI Databases:NLM目录数据库的子数据库,提供NCBI数据库记录中引用的期刊信息,包括PubMed摘要。NCBI维护当前内容并继续支持其与其他NCBI数据库的搜索和集成。数据库中的每个记录都是一组DNA序列。

NCBI分子数据库的应用

(一)数据库页面

NCBI分子数据库如图13-6所示。

(二)数据库分类简介

(1)Assembly:一个提供有关基因组组装结构,装配名称和其他元数据,统计报告以及基因组序列数据链接等信息的数据库。

(2)BioCollections:一个有关培养物、动植物样本和其他自然样本的精选元数据集。记录显示样本状态,有关馆藏的机构的信息,以及NCBI中相关数据链接。

图13-6

(3)BioProject(formerly Genome Project):基因组学,功能基因组学和遗传学研究的集合以及其结果数据集的链接。此资源描述项目范围,材料和目标,并提供一种机制来检索由于注释不一致,多个独立提交以及通常存储在不同数据库中的各种数据类型的不同性质而经常难以找到的数据集。

(4)BioSample:BioSample数据库包含实验测定中使用的生物来源材料的描述。

(5)ClincialTrials.gov:世界各地公开和私人支持的临床研究的登记和结果数据库。

(6)Consensus CDS(CCDS):人类和小鼠一致注释和高质量的核心蛋白质编码区域。

(7)Database of Genomic Structural Variation(dbVar):dbVar数据库储存了大规模基因组变异相关的信息,包括大插入,缺失,易位和倒位。除了分类突变之外,dbVar还存储已定义突变与表型信息的关联。

(8)Database of Genotypes and Phenotypes(dbGaP):储存基因型和表型相互作用研究结果和描述的数据库,这些研究包括全基因组关联(GWAS)、医学重测序、分子诊断,以及基因型与非临床性状之间的关联。

(9)Database of Short Genetic Variations(dbSNP):数据库包含单核苷酸突变、微卫星和小规模插入和缺失信息。

(10)GenBank:NIH基因序列数据库,是所有公开可用DNA序列的注释集合。NCBI的GenBank数据库和日本DNA数据库(DDBJ),欧洲分子生物学实验室(EMBL)每天交换数据,保证数据实时跟新。GenBank由几个部分组成,大部分序列可以通过Nucleotide数据库访问。例外的是EST和GSS分区,分别通过Nucleotide EST和Nucleotide GSS数据库访问。

(11)Gene:一个可搜索的基因数据库,专注于已经完全测序的基因组,并且有一个活跃的研究团体来提供基因特异性数据。基因信息包括命名法、染色体定位、基因产物及其属性(例如,蛋白质相互作用)、相关标记、表型、相互作用、引文链接、序列、突变详情、图谱、表达报告、同源物、蛋白结构域内容和外部数据库链接。

(12)Genes and Disease:选定遗传疾病的信息摘要,讨论潜在的突变和临床特征,以及相关数据库和组织的链接。

(13)Genome:包含来自1000多种生物的全基因组的序列和比对数据。基因组代表完全测序的生物和正在进行测序的生物,三个主要领域细菌,古细菌和真核生物),以及许多病毒,噬菌体,类病毒,质粒和细胞器。

(14)HIV-1,Human Protein Interaction Database:已知HIV-1蛋白与人宿主蛋白相互作用的数据库。它提供了已发表的蛋白质相互作用报告的注释书目,并附有相应PubMed记录和序列数据的链接。

(15)Journals in NCBI Databases:NLM目录数据库的子数据库,提供NCBI数据库记录中引用的期刊信息,包括PubMed摘要。支持期刊标题,MEDLINE或ISO缩写,ISSN或NLM目录ID搜索此数据库。

(16)MeSH Database:MeSH(医学主题词)是美国国家医学图书馆用于索引MEDLINE /PubMed文章的受控词汇表。MeSH术语提供了一种一致的方法来检索可能对相同概念使用不同术语的信息。

(17)MedGen:医学遗传学信息门户,MedGen包含来自多个来源的术语列表,并将它们组织成概念分组和层次分组。还提供了 NIH Genetic Testing Registry(GTR),ClinVar,Gene,OMIM,PubMed和其他来源中的相关链接信息。

(18)National Library of Medicine(NLM)Catalog:图书馆馆藏中所有期刊,书籍,视听,计算机软件,电子资源和其他资料的书目数据。

(19)Nucleotide Database:来自多个来源的核苷酸序列的集合,包括GenBank,RefSeq,第三方注释(TPA)数据库和PDB。

(20)Online Mendelian Inheritance in Man(OMIM):人类基因和遗传疾病的数据库。NCBI维护当前内容并继续支持其与其他NCBI数据库的搜索和集成。但是,OMIM现在在omim.org上有一个新主页,用户可以直接访问该站点进行全面显示。

(21)PopSet:来自比较研究的相关DNA序列的数据库:系统发育,种群,环境以及在较小程度上的突变。数据库中的每个记录都是一组DNA序列。例如,群体集提供有关生物体内遗传变异的信息,而系统发育集可以包含从几个相关生物获得的单个基因的序列及其比对。(www.daowen.com)

(22)Probe:用于各种生物医学研究应用的核酸试剂数据库,有关试剂比例、探针有效性和序列相似性等信息。

(23)Protein Clusters:相关蛋白质序列(簇)的集合,由完整的原核和细胞器质粒和基因组编码的参考序列蛋白组成。该数据库提供对注释信息,出版物,域,结构,外部链接和分析工具的轻松访问。

(24)Protein Database:包含来自各种来源的蛋白质序列记录的数据库,包括GenPept,RefSeq,Swiss-Prot,PIR,PRF和PDB。

(25)PubMed:MEDLINE和其他生命科学期刊的生物医学文献引文和摘要数据库。

(26)PubMed Central(PMC):全文生物医学和生命科学期刊文献,包括临床医学公共卫生

(27)RefSeqGene:人类基因特异性参考基因组序列的集合。

(28)Reference Sequence(RefSeq):由NCBI产生的主持的,非冗余的基因组DNA,转录物(RNA)和蛋白质序列的集合。

(三)常用数据库工具

(1)BLAST Microbial Genomes:对选定的完整真核和原核基因组中的相似序列进行BLAST搜索。

(2)BLAST RefSeqGene:对RefSeqGene/LRG集中的基因组序列进行BLAST搜索。

(3)BLAST Tutorials and Guides:此页面链接到许多与BLAST相关的教程和指南,包括BLAST算法的选择指南,BLAST输出格式的说明,独立BLAST参数的说明,在本地机器上设置独立BLAST的说明以及 使用BLAST URL API。

(4)Basic Local Alignment Search Tool(BLAST):找到生物序列之间的局部相似性区域,该程序将核苷酸或蛋白质序列与序列数据库进行比较,并计算匹配的统计显著性。BLAST可用于推断序列之间的功能和进化关系,以及帮助鉴定基因家族的成员。

(5)COBALT:COBALT是一种蛋白质多序列比对工具,使用RPS-BLAST,BLASTP和PHI-BLAST找到从保守结构域数据库,蛋白质基序数据库和序列相似性衍生的成对约束的集合。

(6)Cn3D:用于从NCBI的Entrez检索服务查看三维结构的独立应用程序。

(7)Conserved Domain Architecture Retrieval Tool(CDART):显示构成给定蛋白质序列的功能域。它列出了具有相似结构域结构的蛋白质,并且可以检索含有特定结构域组合的蛋白质。

(8)Conserved Domain Search Service(CD Search):鉴定蛋白质序列中存在的保守结构域。

(9)Gene Expression Omnibus(GEO)BLAST:用于将查询序列(核苷酸或蛋白质)与包含在GEO数据库中的微阵列或SAGE平台上的GenBank序列对齐的工具。

(10)Genome BLAST:该工具将核苷酸或蛋白质序列与基因组序列数据库进行比较,并使用基本局部比对搜索工具(BLAST)算法计算匹配的统计显著性。

(11)Primer-BLAST:Primer-BLAST工具使用Primer3设计序列模板的PCR引物。然后通过针对用户指定数据库的BLAST搜索自动分析潜在产品,以检查对目标的特异性。

(12)ProSplign:用于计算蛋白质与基因组核苷酸序列的比对的实用程序。

(13)Related Structures:相关结构工具允许用户从分子建模数据库(MMDB)中查找与查询蛋白质序列相似的3D结构。

(14)SNP Database Specialized Search Tools:有多种工具可用于搜索SNP数据库,允许使用BLAST通过基因型,方法,群体,提交者,标记和序列相似性进行搜索。

(15)VecScreen:一种用于快速鉴定可能是载体来源的核酸序列区段的系统。

(16)Vector Alignment Search Tool(VAST):一种识别相似蛋白质三维结构的计算机算法。

(17)Viral Genotyping Tool:该工具有助于识别病毒序列的基因型。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈