• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

BioXSD:日常生物信息学 Web 服务的通用数据交换格式。

BioXSD: the common data-exchange format for everyday bioinformatics web services.

机构信息

Bergen Center for Computational Science, Uni Research, Bergen, Norway.

出版信息

Bioinformatics. 2010 Sep 15;26(18):i540-6. doi: 10.1093/bioinformatics/btq391.

DOI:10.1093/bioinformatics/btq391
PMID:20823319
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2935419/
Abstract

MOTIVATION

The world-wide community of life scientists has access to a large number of public bioinformatics databases and tools, which are developed and deployed using diverse technologies and designs. More and more of the resources offer programmatic web-service interface. However, efficient use of the resources is hampered by the lack of widely used, standard data-exchange formats for the basic, everyday bioinformatics data types.

RESULTS

BioXSD has been developed as a candidate for standard, canonical exchange format for basic bioinformatics data. BioXSD is represented by a dedicated XML Schema and defines syntax for biological sequences, sequence annotations, alignments and references to resources. We have adapted a set of web services to use BioXSD as the input and output format, and implemented a test-case workflow. This demonstrates that the approach is feasible and provides smooth interoperability. Semantics for BioXSD is provided by annotation with the EDAM ontology. We discuss in a separate section how BioXSD relates to other initiatives and approaches, including existing standards and the Semantic Web.

AVAILABILITY

The BioXSD 1.0 XML Schema is freely available at http://www.bioxsd.org/BioXSD-1.0.xsd under the Creative Commons BY-ND 3.0 license. The http://bioxsd.org web page offers documentation, examples of data in BioXSD format, example workflows with source codes in common programming languages, an updated list of compatible web services and tools and a repository of feature requests from the community.

摘要

动机

全球生命科学领域的研究人员可以访问大量公共生物信息学数据库和工具,这些数据库和工具是使用不同的技术和设计开发和部署的。越来越多的资源提供了可编程的 Web 服务接口。然而,由于缺乏广泛使用的、标准的数据交换格式来表示基本的日常生物信息学数据类型,因此这些资源的高效利用受到了阻碍。

结果

BioXSD 已被开发为基本生物信息学数据的标准、规范交换格式的候选者。BioXSD 由专门的 XML 模式表示,并定义了生物序列、序列注释、比对和资源引用的语法。我们已经对一组 Web 服务进行了适配,使其可以使用 BioXSD 作为输入和输出格式,并实现了一个测试用例工作流程。这证明了该方法是可行的,并提供了顺畅的互操作性。BioXSD 的语义由 EDAM 本体进行注释。我们在单独的一节中讨论了 BioXSD 与其他倡议和方法的关系,包括现有标准和语义 Web。

可用性

BioXSD 1.0 XML 模式可在 Creative Commons BY-ND 3.0 许可证下免费从 http://www.bioxsd.org/BioXSD-1.0.xsd 获取。http://bioxsd.org 网页提供了文档、BioXSD 格式的数据示例、带有常见编程语言源代码的示例工作流程、兼容的 Web 服务和工具的更新列表以及来自社区的功能请求存储库。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/112cb8c9d73f/btq391f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/7deb80c0f16b/btq391f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/9a51a098aaa0/btq391f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/a02430a0ffd3/btq391f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/112cb8c9d73f/btq391f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/7deb80c0f16b/btq391f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/9a51a098aaa0/btq391f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/a02430a0ffd3/btq391f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c306/2935419/112cb8c9d73f/btq391f4.jpg

相似文献

1
BioXSD: the common data-exchange format for everyday bioinformatics web services.BioXSD:日常生物信息学 Web 服务的通用数据交换格式。
Bioinformatics. 2010 Sep 15;26(18):i540-6. doi: 10.1093/bioinformatics/btq391.
2
An XML transfer schema for exchange of genomic and genetic mapping data: implementation as a web service in a Taverna workflow.用于基因组和遗传图谱数据交换的 XML 传输模式:作为 Taverna 工作流中的 Web 服务实现。
BMC Bioinformatics. 2009 Aug 14;10:252. doi: 10.1186/1471-2105-10-252.
3
EDAM: an ontology of bioinformatics operations, types of data and identifiers, topics and formats.EDAM:生物信息学操作、数据和标识符类型、主题和格式的本体论。
Bioinformatics. 2013 May 15;29(10):1325-32. doi: 10.1093/bioinformatics/btt113. Epub 2013 Mar 11.
4
Semantic Web Service provision: a realistic framework for Bioinformatics programmers.语义网服务提供:生物信息学程序员的现实框架。
Bioinformatics. 2007 May 1;23(9):1178-80. doi: 10.1093/bioinformatics/btm060. Epub 2007 Mar 24.
5
Biowep: a workflow enactment portal for bioinformatics applications.生物工作流引擎(Biowep):一个用于生物信息学应用的工作流制定门户。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S19. doi: 10.1186/1471-2105-8-S1-S19.
6
Interoperability with Moby 1.0--it's better than sharing your toothbrush!与Moby 1.0的互操作性——这可比共用牙刷好多了!
Brief Bioinform. 2008 May;9(3):220-31. doi: 10.1093/bib/bbn003. Epub 2008 Jan 31.
7
Intelligent client for integrating bioinformatics services.用于整合生物信息学服务的智能客户端。
Bioinformatics. 2006 Jan 1;22(1):106-11. doi: 10.1093/bioinformatics/bti740. Epub 2005 Oct 27.
8
BioServices: a common Python package to access biological Web Services programmatically.生物服务:一个用于通过编程访问生物 Web 服务的通用 Python 包。
Bioinformatics. 2013 Dec 15;29(24):3241-2. doi: 10.1093/bioinformatics/btt547. Epub 2013 Sep 23.
9
YeastHub: a semantic web use case for integrating data in the life sciences domain.酵母中心:生命科学领域数据整合的语义网用例。
Bioinformatics. 2005 Jun;21 Suppl 1:i85-96. doi: 10.1093/bioinformatics/bti1026.
10
A framework based on Web service orchestration for bioinformatics workflow management.一种基于Web服务编排的生物信息学工作流管理框架。
Genet Mol Res. 2005 Sep 30;4(3):535-42.

引用本文的文献

1
The Biological Object Notation (BON): a structured file format for biological data.生物对象标记 (BON):一种用于生物数据的结构化文件格式。
Sci Rep. 2018 Jun 25;8(1):9644. doi: 10.1038/s41598-018-28016-6.
2
Semantic biomedical resource discovery: a Natural Language Processing framework.语义生物医学资源发现:一种自然语言处理框架。
BMC Med Inform Decis Mak. 2015 Sep 30;15:77. doi: 10.1186/s12911-015-0200-4.
3
Experiences with workflows for automating data-intensive bioinformatics.自动化数据密集型生物信息学工作流程的经验。

本文引用的文献

1
The EMBRACE web service collection.EMBRACE 网络服务集合。
Nucleic Acids Res. 2010 Jul;38(Web Server issue):W683-8. doi: 10.1093/nar/gkq297. Epub 2010 May 12.
2
phiSITE: database of gene regulation in bacteriophages.phiSITE:噬菌体基因调控数据库。
Nucleic Acids Res. 2010 Jan;38(Database issue):D366-70. doi: 10.1093/nar/gkp911. Epub 2009 Nov 9.
3
phyloXML: XML for evolutionary biology and comparative genomics.phyloXML:用于进化生物学和比较基因组学的 XML。
Biol Direct. 2015 Aug 19;10:43. doi: 10.1186/s13062-015-0071-8.
4
FreeContact: fast and free software for protein contact prediction from residue co-evolution.FreeContact:用于基于残基共进化预测蛋白质接触的快速免费软件。
BMC Bioinformatics. 2014 Mar 26;15:85. doi: 10.1186/1471-2105-15-85.
5
Integrated Bio-Search: challenges and trends for the integration, search and comprehensive processing of biological information.综合生物检索:生物信息的整合、检索和全面处理所面临的挑战和趋势。
BMC Bioinformatics. 2014;15 Suppl 1(Suppl 1):S2. doi: 10.1186/1471-2105-15-S1-S2. Epub 2014 Jan 10.
6
BioHackathon series in 2011 and 2012: penetration of ontology and linked data in life science domains.2011年和2012年的生物黑客马拉松系列活动:本体论和关联数据在生命科学领域的渗透。
J Biomed Semantics. 2014 Feb 5;5(1):5. doi: 10.1186/2041-1480-5-5.
7
BioUSeR: a semantic-based tool for retrieving Life Science web resources driven by text-rich user requirements.BioUSeR:一种基于语义的工具,用于根据丰富的文本用户需求检索生命科学网络资源。
J Biomed Semantics. 2013 May 1;4(1):12. doi: 10.1186/2041-1480-4-12.
8
EDAM: an ontology of bioinformatics operations, types of data and identifiers, topics and formats.EDAM:生物信息学操作、数据和标识符类型、主题和格式的本体论。
Bioinformatics. 2013 May 15;29(10):1325-32. doi: 10.1093/bioinformatics/btt113. Epub 2013 Mar 11.
9
Gene Fusion Markup Language: a prototype for exchanging gene fusion data.基因融合标记语言:用于交换基因融合数据的原型。
BMC Bioinformatics. 2012 Oct 16;13:269. doi: 10.1186/1471-2105-13-269.
10
Identifying elemental genomic track types and representing them uniformly.识别元素基因组轨迹类型并统一表示它们。
BMC Bioinformatics. 2011 Dec 30;12:494. doi: 10.1186/1471-2105-12-494.
BMC Bioinformatics. 2009 Oct 27;10:356. doi: 10.1186/1471-2105-10-356.
4
The Universal Protein Resource (UniProt) in 2010.2010 年的通用蛋白质资源(UniProt)。
Nucleic Acids Res. 2010 Jan;38(Database issue):D142-8. doi: 10.1093/nar/gkp846. Epub 2009 Oct 20.
5
An active registry for bioinformatics web services.生物信息学网络服务的活动注册中心。
Bioinformatics. 2009 Aug 15;25(16):2090-1. doi: 10.1093/bioinformatics/btp329. Epub 2009 May 21.
6
The Protein Feature Ontology: a tool for the unification of protein feature annotations.蛋白质特征本体论:一种统一蛋白质特征注释的工具。
Bioinformatics. 2008 Dec 1;24(23):2767-72. doi: 10.1093/bioinformatics/btn528. Epub 2008 Oct 20.
7
Experience using web services for biological sequence analysis.使用网络服务进行生物序列分析的经验。
Brief Bioinform. 2008 Nov;9(6):493-505. doi: 10.1093/bib/bbn029. Epub 2008 Jul 11.
8
A standard MIGS/MIMS compliant XML Schema: toward the development of the Genomic Contextual Data Markup Language (GCDML).一种符合标准MIGS/MIMS的XML模式:迈向基因组上下文数据标记语言(GCDML)的发展。
OMICS. 2008 Jun;12(2):115-21. doi: 10.1089/omi.2008.0A10.
9
Integrating sequence and structural biology with DAS.将序列和结构生物学与DAS相结合。
BMC Bioinformatics. 2007 Sep 12;8:333. doi: 10.1186/1471-2105-8-333.
10
MaxAlign: maximizing usable data in an alignment.最大比对:在比对中最大化可用数据。
BMC Bioinformatics. 2007 Aug 28;8:312. doi: 10.1186/1471-2105-8-312.