• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于生物多样性数据检索、清理和质量控制的半自动工作流程。

A semi-automated workflow for biodiversity data retrieval, cleaning, and quality control.

作者信息

Mathew Cherian, Güntsch Anton, Obst Matthias, Vicario Saverio, Haines Robert, Williams Alan R, de Jong Yde, Goble Carole

机构信息

Freie Universität Berlin, Botanic Garden and Botanical Museum Berlin-Dahlem, Berlin, Germany.

Department of Biological and Environmental Sciences, University of Gothenburg, Gothenburg, Sweden.

出版信息

Biodivers Data J. 2014 Dec 11(2):e4221. doi: 10.3897/BDJ.2.e4221. eCollection 2014.

DOI:10.3897/BDJ.2.e4221
PMID:25535486
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4267104/
Abstract

The compilation and cleaning of data needed for analyses and prediction of species distributions is a time consuming process requiring a solid understanding of data formats and service APIs provided by biodiversity informatics infrastructures. We designed and implemented a Taverna-based Data Refinement Workflow which integrates taxonomic data retrieval, data cleaning, and data selection into a consistent, standards-based, and effective system hiding the complexity of underlying service infrastructures. The workflow can be freely used both locally and through a web-portal which does not require additional software installations by users.

摘要

用于分析和预测物种分布的数据编译与清理是一个耗时的过程,需要对生物多样性信息基础设施提供的数据格式和服务应用程序编程接口有扎实的理解。我们设计并实现了一个基于Taverna的数据精炼工作流程,该流程将分类数据检索、数据清理和数据选择集成到一个一致的、基于标准且有效的系统中,隐藏了底层服务基础设施的复杂性。该工作流程既可以在本地免费使用,也可以通过一个无需用户额外安装软件的网络门户使用。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/6d19b498bbf8/biodiversity_data_journal-2-e4221-g005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/699212cd5ed6/biodiversity_data_journal-2-e4221-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/b5862e4b7939/biodiversity_data_journal-2-e4221-g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/c3d93d5b92bb/biodiversity_data_journal-2-e4221-g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/6d19b498bbf8/biodiversity_data_journal-2-e4221-g005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/699212cd5ed6/biodiversity_data_journal-2-e4221-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/b5862e4b7939/biodiversity_data_journal-2-e4221-g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/c3d93d5b92bb/biodiversity_data_journal-2-e4221-g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/00fe/4267104/6d19b498bbf8/biodiversity_data_journal-2-e4221-g005.jpg

相似文献

1
A semi-automated workflow for biodiversity data retrieval, cleaning, and quality control.一种用于生物多样性数据检索、清理和质量控制的半自动工作流程。
Biodivers Data J. 2014 Dec 11(2):e4221. doi: 10.3897/BDJ.2.e4221. eCollection 2014.
2
CaGrid Workflow Toolkit: a Taverna based workflow tool for cancer grid.CaGrid 工作流工具包:一个基于 Taverna 的癌症网格工作流工具。
BMC Bioinformatics. 2010 Nov 2;11:542. doi: 10.1186/1471-2105-11-542.
3
A new semi-automated workflow for chemical data retrieval and quality checking for modeling applications.一种用于建模应用的化学数据检索和质量检查的新型半自动工作流程。
J Cheminform. 2018 Dec 10;10(1):60. doi: 10.1186/s13321-018-0315-6.
4
Biowep: a workflow enactment portal for bioinformatics applications.生物工作流引擎(Biowep):一个用于生物信息学应用的工作流制定门户。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S19. doi: 10.1186/1471-2105-8-S1-S19.
5
BioVeL: a virtual laboratory for data analysis and modelling in biodiversity science and ecology.生物多样性虚拟实验室(BioVeL):一个用于生物多样性科学与生态学数据分析及建模的虚拟实验室。
BMC Ecol. 2016 Oct 20;16(1):49. doi: 10.1186/s12898-016-0103-y.
6
Building essential biodiversity variables (EBVs) of species distribution and abundance at a global scale.在全球范围内构建物种分布和丰度的基本生物多样性变量 (EBVs)。
Biol Rev Camb Philos Soc. 2018 Feb;93(1):600-625. doi: 10.1111/brv.12359. Epub 2017 Aug 2.
7
The Taverna Interaction Service: enabling manual interaction in workflows.Taverna交互服务:实现工作流中的手动交互。
Bioinformatics. 2008 Apr 15;24(8):1118-20. doi: 10.1093/bioinformatics/btn082. Epub 2008 Mar 12.
8
Automated manipulation of systems biology models using libSBML within Taverna workflows.在Taverna工作流中使用libSBML对系统生物学模型进行自动化操作。
Bioinformatics. 2008 Jan 15;24(2):287-9. doi: 10.1093/bioinformatics/btm578. Epub 2007 Dec 1.
9
Integrating ARC grid middleware with Taverna workflows.将ARC网格中间件与Taverna工作流集成。
Bioinformatics. 2008 May 1;24(9):1221-2. doi: 10.1093/bioinformatics/btn095. Epub 2008 Mar 19.
10
Biodiversity information platforms: From standards to interoperability.生物多样性信息平台:从标准到互操作性。
Zookeys. 2011(150):71-87. doi: 10.3897/zookeys.150.2166. Epub 2011 Nov 28.

引用本文的文献

1
Pytaxon: A Python software for resolving and correcting taxonomic names in biodiversity data.Pytaxon:一款用于解析和纠正生物多样性数据中分类学名称的Python软件。
Biodivers Data J. 2025 Jan 8;13:e138257. doi: 10.3897/BDJ.13.e138257. eCollection 2025.
2
Improved standardization of transcribed digital specimen data.转录数字标本数据的标准化得到改进。
Database (Oxford). 2019 Jan 1;2019. doi: 10.1093/database/baz129.
3
Research applications of primary biodiversity databases in the digital age.生物多样性基础数据库在数字时代的研究应用。

本文引用的文献

1
The Taverna workflow suite: designing and executing workflows of Web Services on the desktop, web or in the cloud.Taverna 工作流套件:在桌面、网络或云端设计和执行 Web 服务工作流。
Nucleic Acids Res. 2013 Jul;41(Web Server issue):W557-61. doi: 10.1093/nar/gkt328. Epub 2013 May 2.
2
Biodiversity information platforms: From standards to interoperability.生物多样性信息平台:从标准到互操作性。
Zookeys. 2011(150):71-87. doi: 10.3897/zookeys.150.2166. Epub 2011 Nov 28.
PLoS One. 2019 Sep 11;14(9):e0215794. doi: 10.1371/journal.pone.0215794. eCollection 2019.
4
Toward a service-based workflow for automated information extraction from herbarium specimens.朝向基于服务的工作流程,实现植物标本馆标本自动化信息提取。
Database (Oxford). 2018 Jan 1;2018:bay103. doi: 10.1093/database/bay103.
5
AnnoSys-implementation of a generic annotation system for schema-based data using the example of biodiversity collection data.AnnoSys——以生物多样性收集数据为例,实现基于模式的数据的通用注释系统。
Database (Oxford). 2017 Jan 1;2017(1). doi: 10.1093/database/bax018.
6
BioVeL: a virtual laboratory for data analysis and modelling in biodiversity science and ecology.生物多样性虚拟实验室(BioVeL):一个用于生物多样性科学与生态学数据分析及建模的虚拟实验室。
BMC Ecol. 2016 Oct 20;16(1):49. doi: 10.1186/s12898-016-0103-y.
7
B-HIT - A Tool for Harvesting and Indexing Biodiversity Data.B-HIT - 一种用于收集和索引生物多样性数据的工具。
PLoS One. 2015 Nov 6;10(11):e0142240. doi: 10.1371/journal.pone.0142240. eCollection 2015.
8
PESI - a taxonomic backbone for Europe.PESI——欧洲的分类学主干。
Biodivers Data J. 2015 Sep 28(3):e5848. doi: 10.3897/BDJ.3.e5848. eCollection 2015.
9
Trends in IT Innovation to Build a Next Generation Bioinformatics Solution to Manage and Analyse Biological Big Data Produced by NGS Technologies.构建下一代生物信息学解决方案以管理和分析由新一代测序技术产生的生物大数据的信息技术创新趋势。
Biomed Res Int. 2015;2015:904541. doi: 10.1155/2015/904541. Epub 2015 Jun 1.
10
A global perspective on decadal challenges and priorities in biodiversity informatics.生物多样性信息学十年挑战与优先事项的全球视角。
BMC Ecol. 2015 May 29;15:15. doi: 10.1186/s12898-015-0046-8.