• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

B-HIT - 一种用于收集和索引生物多样性数据的工具。

B-HIT - A Tool for Harvesting and Indexing Biodiversity Data.

作者信息

Kelbert Patricia, Droege Gabriele, Barker Katharine, Braak Kyle, Cawsey E Margaret, Coddington Jonathan, Robertson Tim, Whitacre Jamie, Güntsch Anton

机构信息

Botanic Garden and Botanical Museum Berlin-Dahlem, Freie Universität Berlin, Berlin, Germany.

National Museum of Natural History, Smithsonian Institution, Washington DC, United States of America.

出版信息

PLoS One. 2015 Nov 6;10(11):e0142240. doi: 10.1371/journal.pone.0142240. eCollection 2015.

DOI:10.1371/journal.pone.0142240
PMID:26544980
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4636251/
Abstract

With the rapidly growing number of data publishers, the process of harvesting and indexing information to offer advanced search and discovery becomes a critical bottleneck in globally distributed primary biodiversity data infrastructures. The Global Biodiversity Information Facility (GBIF) implemented a Harvesting and Indexing Toolkit (HIT), which largely automates data harvesting activities for hundreds of collection and observational data providers. The team of the Botanic Garden and Botanical Museum Berlin-Dahlem has extended this well-established system with a range of additional functions, including improved processing of multiple taxon identifications, the ability to represent associations between specimen and observation units, new data quality control and new reporting capabilities. The open source software B-HIT can be freely installed and used for setting up thematic networks serving the demands of particular user groups.

摘要

随着数据发布者数量的迅速增长,收集和索引信息以提供高级搜索和发现功能的过程成为全球分布式原生生物多样性数据基础设施中的一个关键瓶颈。全球生物多样性信息机构(GBIF)实施了一个收集和索引工具包(HIT),该工具包在很大程度上实现了数百个收集和观测数据提供者的数据收集活动自动化。柏林 - 达勒姆植物园和植物博物馆的团队为这个成熟的系统扩展了一系列附加功能,包括改进对多个分类群鉴定的处理、表示标本与观测单位之间关联的能力、新的数据质量控制和新的报告功能。开源软件B - HIT可以免费安装并用于建立满足特定用户群体需求的主题网络。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/b29cec60ddac/pone.0142240.g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/6595203313b5/pone.0142240.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/1ee2230924ef/pone.0142240.g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/c82e7fe27f8c/pone.0142240.g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/b29cec60ddac/pone.0142240.g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/6595203313b5/pone.0142240.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/1ee2230924ef/pone.0142240.g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/c82e7fe27f8c/pone.0142240.g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb7/4636251/b29cec60ddac/pone.0142240.g004.jpg

相似文献

1
B-HIT - A Tool for Harvesting and Indexing Biodiversity Data.B-HIT - 一种用于收集和索引生物多样性数据的工具。
PLoS One. 2015 Nov 6;10(11):e0142240. doi: 10.1371/journal.pone.0142240. eCollection 2015.
2
BIDDSAT: visualizing the content of biodiversity data publishers in the Global Biodiversity Information Facility network.BIDDSAT:在全球生物多样性信息设施网络中可视化生物多样性数据发布者的内容。
Bioinformatics. 2012 Aug 15;28(16):2207-8. doi: 10.1093/bioinformatics/bts359. Epub 2012 Jun 23.
3
Interoperability of biodiversity databases: biodiversity information on every desktop.生物多样性数据库的互操作性:让每个桌面都能获取生物多样性信息。
Science. 2000 Sep 29;289(5488):2312-4. doi: 10.1126/science.289.5488.2312.
4
SDMdata: A Web-Based Software Tool for Collecting Species Occurrence Records.SDMdata:一个用于收集物种出现记录的基于网络的软件工具。
PLoS One. 2015 Jun 1;10(6):e0128295. doi: 10.1371/journal.pone.0128295. eCollection 2015.
5
Harvesting chemical information from the Internet using a distributed approach: ChemXtreme.使用分布式方法从互联网上获取化学信息:ChemXtreme
J Chem Inf Model. 2006 Mar-Apr;46(2):452-61. doi: 10.1021/ci050329+.
6
Indexing the Internet.为互联网编制索引。
Science. 1995 Sep 8;269(5229):1354-6. doi: 10.1126/science.7660117.
7
Interactive and fuzzy search: a dynamic way to explore MEDLINE.交互式和模糊搜索:探索 MEDLINE 的动态方式。
Bioinformatics. 2010 Sep 15;26(18):2321-7. doi: 10.1093/bioinformatics/btq414. Epub 2010 Jul 12.
8
Assessing the primary data hosted by the Spanish node of the Global Biodiversity Information Facility (GBIF).评估全球生物多样性信息设施(GBIF)西班牙节点托管的原始数据。
PLoS One. 2013;8(1):e55144. doi: 10.1371/journal.pone.0055144. Epub 2013 Jan 25.
9
Data integration enables global biodiversity synthesis.数据集成促进全球生物多样性综合研究。
Proc Natl Acad Sci U S A. 2021 Feb 9;118(6). doi: 10.1073/pnas.2018093118.
10
The quiet revolution: biodiversity informatics and the internet.悄然兴起的革命:生物多样性信息学与互联网
Science. 2000 Sep 29;289(5488):2309-12. doi: 10.1126/science.289.5488.2309.

引用本文的文献

1
MergedTrie: Efficient textual indexing.合并 Trie:高效的文本索引。
PLoS One. 2019 Apr 23;14(4):e0215288. doi: 10.1371/journal.pone.0215288. eCollection 2019.
2
The Global Genome Biodiversity Network (GGBN) Data Standard specification.全球基因组生物多样性网络(GGBN)数据标准规范
Database (Oxford). 2016 Oct 2;2016. doi: 10.1093/database/baw125. Print 2016.

本文引用的文献

1
A semi-automated workflow for biodiversity data retrieval, cleaning, and quality control.一种用于生物多样性数据检索、清理和质量控制的半自动工作流程。
Biodivers Data J. 2014 Dec 11(2):e4221. doi: 10.3897/BDJ.2.e4221. eCollection 2014.
2
The GBIF integrated publishing toolkit: facilitating the efficient publishing of biodiversity data on the internet.GBIF 集成出版工具包:促进互联网上生物多样性数据的高效出版。
PLoS One. 2014 Aug 6;9(8):e102623. doi: 10.1371/journal.pone.0102623. eCollection 2014.
3
The Global Genome Biodiversity Network (GGBN) Data Portal.
全球基因组生物多样性网络(GGBN)数据门户。
Nucleic Acids Res. 2014 Jan;42(Database issue):D607-12. doi: 10.1093/nar/gkt928. Epub 2013 Oct 16.
4
OpenUp! Creating a cross-domain pipeline for natural history data.开放!创建一个用于自然史数据的跨领域管道。
Zookeys. 2012(209):47-54. doi: 10.3897/zookeys.209.3179. Epub 2012 Jul 20.
5
Darwin Core: an evolving community-developed biodiversity data standard.达尔文核心:一个不断发展的社区开发的生物多样性数据标准。
PLoS One. 2012;7(1):e29715. doi: 10.1371/journal.pone.0029715. Epub 2012 Jan 6.
6
Biodiversity information platforms: From standards to interoperability.生物多样性信息平台:从标准到互操作性。
Zookeys. 2011(150):71-87. doi: 10.3897/zookeys.150.2166. Epub 2011 Nov 28.