• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SeqHound:作为生物信息学研究平台的生物序列与结构数据库

SeqHound: biological sequence and structure database as a platform for bioinformatics research.

作者信息

Michalickova Katerina, Bader Gary D, Dumontier Michel, Lieu Hao, Betel Doron, Isserlin Ruth, Hogue Christopher W V

机构信息

Department of Biochemistry, University of Toronto, Toronto, Ontario, Canada M5S 1A8.

出版信息

BMC Bioinformatics. 2002 Oct 25;3:32. doi: 10.1186/1471-2105-3-32.

DOI:10.1186/1471-2105-3-32
PMID:12401134
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC138791/
Abstract

BACKGROUND

SeqHound has been developed as an integrated biological sequence, taxonomy, annotation and 3-D structure database system. It provides a high-performance server platform for bioinformatics research in a locally-hosted environment.

RESULTS

SeqHound is based on the National Center for Biotechnology Information data model and programming tools. It offers daily updated contents of all Entrez sequence databases in addition to 3-D structural data and information about sequence redundancies, sequence neighbours, taxonomy, complete genomes, functional annotation including Gene Ontology terms and literature links to PubMed. SeqHound is accessible via a web server through a Perl, C or C++ remote API or an optimized local API. It provides functionality necessary to retrieve specialized subsets of sequences, structures and structural domains. Sequences may be retrieved in FASTA, GenBank, ASN.1 and XML formats. Structures are available in ASN.1, XML and PDB formats. Emphasis has been placed on complete genomes, taxonomy, domain and functional annotation as well as 3-D structural functionality in the API, while fielded text indexing functionality remains under development. SeqHound also offers a streamlined WWW interface for simple web-user queries.

CONCLUSIONS

The system has proven useful in several published bioinformatics projects such as the BIND database and offers a cost-effective infrastructure for research. SeqHound will continue to develop and be provided as a service of the Blueprint Initiative at the Samuel Lunenfeld Research Institute. The source code and examples are available under the terms of the GNU public license at the Sourceforge site http://sourceforge.net/projects/slritools/ in the SLRI Toolkit.

摘要

背景

SeqHound已被开发为一个集成的生物序列、分类学、注释和三维结构数据库系统。它在本地托管环境中为生物信息学研究提供了一个高性能服务器平台。

结果

SeqHound基于美国国立生物技术信息中心的数据模型和编程工具。除了三维结构数据以及有关序列冗余、序列邻接、分类学、完整基因组、包括基因本体术语的功能注释和与PubMed的文献链接等信息外,它还提供所有Entrez序列数据库的每日更新内容。可通过网页服务器,经由Perl、C或C++远程应用程序编程接口(API)或优化的本地API访问SeqHound。它提供检索序列、结构和结构域的特定子集所需的功能。序列可以以FASTA、GenBank、ASN.1和XML格式检索。结构以ASN.1、XML和PDB格式提供。API重点关注完整基因组、分类学、结构域和功能注释以及三维结构功能,而字段文本索引功能仍在开发中。SeqHound还提供了一个简化的万维网界面,用于简单的网络用户查询。

结论

该系统已在多个已发表的生物信息学项目(如BIND数据库)中证明有用,并为研究提供了具有成本效益的基础设施。SeqHound将继续开发,并作为塞缪尔·伦嫩费尔德研究所蓝图计划的一项服务提供。源代码和示例可在Sourceforge网站http://sourceforge.net/projects/slritools/的SLRI工具包中根据GNU公共许可证的条款获得。

相似文献

1
SeqHound: biological sequence and structure database as a platform for bioinformatics research.SeqHound:作为生物信息学研究平台的生物序列与结构数据库
BMC Bioinformatics. 2002 Oct 25;3:32. doi: 10.1186/1471-2105-3-32.
2
Atlas - a data warehouse for integrative bioinformatics.阿特拉斯——一个用于整合生物信息学的数据仓库。
BMC Bioinformatics. 2005 Feb 21;6:34. doi: 10.1186/1471-2105-6-34.
3
GeneTools--application for functional annotation and statistical hypothesis testing.基因工具——用于功能注释和统计假设检验的应用程序。
BMC Bioinformatics. 2006 Oct 24;7:470. doi: 10.1186/1471-2105-7-470.
4
Windows .NET Network Distributed Basic Local Alignment Search Toolkit (W.ND-BLAST).Windows .NET网络分布式基本局部比对搜索工具包(W.ND-BLAST)。
BMC Bioinformatics. 2005 Apr 8;6:93. doi: 10.1186/1471-2105-6-93.
5
BioXSD: the common data-exchange format for everyday bioinformatics web services.BioXSD:日常生物信息学 Web 服务的通用数据交换格式。
Bioinformatics. 2010 Sep 15;26(18):i540-6. doi: 10.1093/bioinformatics/btq391.
6
The new protein topology graph library web server.新型蛋白质拓扑结构图库网络服务器。
Bioinformatics. 2016 Feb 1;32(3):474-6. doi: 10.1093/bioinformatics/btv574. Epub 2015 Oct 6.
7
Database resources of the National Center for Biotechnology Information.国家生物技术信息中心数据库资源。
Nucleic Acids Res. 2010 Jan;38(Database issue):D5-16. doi: 10.1093/nar/gkp967. Epub 2009 Nov 12.
8
CBS Genome Atlas Database: a dynamic storage for bioinformatic results and sequence data.CBS基因组图谱数据库:生物信息学结果和序列数据的动态存储库。
Bioinformatics. 2004 Dec 12;20(18):3682-6. doi: 10.1093/bioinformatics/bth423. Epub 2004 Jul 15.
9
Biskit--a software platform for structural bioinformatics.Biskit——一个用于结构生物信息学的软件平台。
Bioinformatics. 2007 Mar 15;23(6):769-70. doi: 10.1093/bioinformatics/btl655. Epub 2007 Jan 18.
10
EST processing: from trace to sequence.EST处理:从痕量到序列
Methods Mol Biol. 2009;533:189-220. doi: 10.1007/978-1-60327-136-3_9.

引用本文的文献

1
Splicosomal and serine and arginine-rich splicing factors as targets for TGF-β.剪接体以及富含丝氨酸和精氨酸的剪接因子作为转化生长因子-β的作用靶点。
Fibrogenesis Tissue Repair. 2012 Apr 28;5(1):6. doi: 10.1186/1755-1536-5-6.
2
High-throughput discovery and characterization of fetal protein trafficking in the blood of pregnant women.高通量发现和鉴定孕妇血液中的胎儿蛋白转运。
Proteomics Clin Appl. 2009 Dec;3(12):1389-96. doi: 10.1002/prca.200900109.
3
SNAD: Sequence Name Annotation-based Designer.SNAD:基于序列名称注释的设计器。

本文引用的文献

1
Kangaroo--a pattern-matching program for biological sequences.袋鼠——一个用于生物序列的模式匹配程序。
BMC Bioinformatics. 2002 Jul 31;3:20. doi: 10.1186/1471-2105-3-20.
2
NBLAST: a cluster variant of BLAST for NxN comparisons.NBLAST:一种用于NxN比较的BLAST聚类变体。
BMC Bioinformatics. 2002 May 8;3:13. doi: 10.1186/1471-2105-3-13.
3
CDD: a database of conserved domain alignments with links to domain three-dimensional structure.CDD:一个保守结构域比对数据库,带有与结构域三维结构的链接。
BMC Bioinformatics. 2009 Aug 14;10:251. doi: 10.1186/1471-2105-10-251.
4
ArrayPlex: distributed, interactive and programmatic access to genome sequence, annotation, ontology, and analytical toolsets.ArrayPlex:对基因组序列、注释、本体论和分析工具集进行分布式、交互式和编程式访问。
Genome Biol. 2008;9(11):R159. doi: 10.1186/gb-2008-9-11-r159. Epub 2008 Nov 12.
5
BIRCH: a user-oriented, locally-customizable, bioinformatics system.BIRCH:一个面向用户、可本地定制的生物信息学系统。
BMC Bioinformatics. 2007 Feb 9;8:54. doi: 10.1186/1471-2105-8-54.
6
Discovering biological guilds through topological abstraction.通过拓扑抽象发现生物群落。
AMIA Annu Symp Proc. 2006;2006:1-5.
7
DiscoverySpace: an interactive data analysis application.发现空间:一个交互式数据分析应用程序。
Genome Biol. 2007;8(1):R6. doi: 10.1186/gb-2007-8-1-r6.
8
Hedgehog Signaling Pathway Database: a repository of current annotation efforts and resources for the Hh research community.刺猬信号通路数据库:一个为刺猬信号通路研究群体提供当前注释工作和资源的知识库。
Nucleic Acids Res. 2007 Jan;35(Database issue):D595-8. doi: 10.1093/nar/gkl1012. Epub 2006 Dec 6.
9
PROMPT: a protein mapping and comparison tool.提示:一种蛋白质图谱绘制与比较工具。
BMC Bioinformatics. 2006 Jul 4;7:331. doi: 10.1186/1471-2105-7-331.
10
SIMAP: the similarity matrix of proteins.SIMAP:蛋白质相似性矩阵。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D252-6. doi: 10.1093/nar/gkj106.
Nucleic Acids Res. 2002 Jan 1;30(1):281-3. doi: 10.1093/nar/30.1.281.
4
The Pfam protein families database.Pfam蛋白质家族数据库。
Nucleic Acids Res. 2002 Jan 1;30(1):276-80. doi: 10.1093/nar/30.1.276.
5
MMDB: Entrez's 3D-structure database.MMDB:Entrez的三维结构数据库。
Nucleic Acids Res. 2002 Jan 1;30(1):249-52. doi: 10.1093/nar/30.1.249.
6
Recent improvements to the SMART domain-based sequence annotation resource.基于SMART结构域的序列注释资源的近期改进。
Nucleic Acids Res. 2002 Jan 1;30(1):242-4. doi: 10.1093/nar/30.1.242.
7
The Protein Information Resource: an integrated public resource of functional annotation of proteins.蛋白质信息资源:蛋白质功能注释的综合公共资源。
Nucleic Acids Res. 2002 Jan 1;30(1):35-7. doi: 10.1093/nar/30.1.35.
8
The EMBL Nucleotide Sequence Database.欧洲分子生物学实验室核苷酸序列数据库。
Nucleic Acids Res. 2002 Jan 1;30(1):21-6. doi: 10.1093/nar/30.1.21.
9
GenBank.基因银行
Nucleic Acids Res. 2002 Jan 1;30(1):17-20. doi: 10.1093/nar/30.1.17.
10
Creating the gene ontology resource: design and implementation.创建基因本体资源:设计与实现
Genome Res. 2001 Aug;11(8):1425-33. doi: 10.1101/gr.180801.