• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

地理增强(GeoBoost):加速涉及病毒基因库记录地理空间元数据的研究。

GeoBoost: accelerating research involving the geospatial metadata of virus GenBank records.

作者信息

Tahsin Tasnia, Weissenbacher Davy, O'Connor Karen, Magge Arjun, Scotch Matthew, Gonzalez-Hernandez Graciela

机构信息

Department of Biomedical Informatics, Arizona State University, Scottsdale, AZ 85259, USA.

Institute of Biomedical Informatics, Perelman School of Medicine, University of Pennsylvania, Philadelphia, PA 19104, USA.

出版信息

Bioinformatics. 2018 May 1;34(9):1606-1608. doi: 10.1093/bioinformatics/btx799.

DOI:10.1093/bioinformatics/btx799
PMID:29240889
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5925778/
Abstract

SUMMARY

GeoBoost is a command-line software package developed to address sparse or incomplete metadata in GenBank sequence records that relate to the location of the infected host (LOIH) of viruses. Given a set of GenBank accession numbers corresponding to virus GenBank records, GeoBoost extracts, integrates and normalizes geographic information reflecting the LOIH of the viruses using integrated information from GenBank metadata and related full-text publications. In addition, to facilitate probabilistic geospatial modeling, GeoBoost assigns probability scores for each possible LOIH.

AVAILABILITY AND IMPLEMENTATION

Binaries and resources required for running GeoBoost are packed into a single zipped file and freely available for download at https://tinyurl.com/geoboost. A video tutorial is included to help users quickly and easily install and run the software. The software is implemented in Java 1.8, and supported on MS Windows and Linux platforms.

CONTACT

gragon@upenn.edu.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

GeoBoost是一个命令行软件包,旨在处理GenBank序列记录中与病毒感染宿主位置(LOIH)相关的稀疏或不完整元数据。给定一组与病毒GenBank记录对应的GenBank登录号,GeoBoost利用来自GenBank元数据和相关全文出版物的综合信息,提取、整合并规范反映病毒LOIH的地理信息。此外,为便于进行概率地理空间建模,GeoBoost为每个可能的LOIH分配概率分数。

可用性与实现

运行GeoBoost所需的二进制文件和资源被打包成一个压缩文件,可在https://tinyurl.com/geoboost免费下载。包含一个视频教程,以帮助用户快速轻松地安装和运行该软件。该软件用Java 1.8实现,支持MS Windows和Linux平台。

联系方式

gragon@upenn.edu。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
GeoBoost: accelerating research involving the geospatial metadata of virus GenBank records.地理增强(GeoBoost):加速涉及病毒基因库记录地理空间元数据的研究。
Bioinformatics. 2018 May 1;34(9):1606-1608. doi: 10.1093/bioinformatics/btx799.
2
A high-precision rule-based extraction system for expanding geospatial metadata in GenBank records.一种用于扩展GenBank记录中地理空间元数据的基于规则的高精度提取系统。
J Am Med Inform Assoc. 2016 Sep;23(5):934-41. doi: 10.1093/jamia/ocv172. Epub 2016 Jan 17.
3
GeoBoost2: a natural languageprocessing pipeline for GenBank metadata enrichment for virus phylogeography.GeoBoost2:一种用于 GenBank 元数据病毒系统地理学丰富化的自然语言处理管道。
Bioinformatics. 2020 Dec 22;36(20):5120-5121. doi: 10.1093/bioinformatics/btaa647.
4
grabseqs: simple downloading of reads and metadata from multiple next-generation sequencing data repositories.grabseqs:从多个下一代测序数据存储库中简单地下载读取和元数据。
Bioinformatics. 2020 Jun 1;36(11):3607-3609. doi: 10.1093/bioinformatics/btaa167.
5
GenBank as a source to monitor and analyze Host-Microbiome data.利用 GenBank 监测和分析宿主-微生物组数据。
Bioinformatics. 2022 Sep 2;38(17):4172-4177. doi: 10.1093/bioinformatics/btac487.
6
quincunx: an R package to query, download and wrangle PGS Catalog data.quincunx:一个用于查询、下载和整理 PGS Catalog 数据的 R 包。
Bioinformatics. 2021 Dec 22;38(1):294-296. doi: 10.1093/bioinformatics/btab522.
7
DFAST: a flexible prokaryotic genome annotation pipeline for faster genome publication.DFAST:一个灵活的原核生物基因组注释管道,用于更快地发布基因组。
Bioinformatics. 2018 Mar 15;34(6):1037-1039. doi: 10.1093/bioinformatics/btx713.
8
Knowledge-driven geospatial location resolution for phylogeographic models of virus migration.用于病毒迁移系统发育地理学模型的知识驱动型地理空间定位解析
Bioinformatics. 2015 Jun 15;31(12):i348-56. doi: 10.1093/bioinformatics/btv259.
9
Metadata retrieval from sequence databases with ffq.利用 ffq 从序列数据库中检索元数据。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac667.
10
Sequence database versioning for command line and Galaxy bioinformatics servers.用于命令行和Galaxy生物信息学服务器的序列数据库版本控制。
Bioinformatics. 2016 Apr 15;32(8):1275-7. doi: 10.1093/bioinformatics/btv724. Epub 2015 Dec 12.

引用本文的文献

1
Detection of patient metadata in published articles for genomic epidemiology using machine learning and large language models.使用机器学习和大语言模型在已发表文章中检测用于基因组流行病学的患者元数据。
medRxiv. 2025 Apr 28:2025.04.25.25326298. doi: 10.1101/2025.04.25.25326298.
2
Patient-Related Metadata Reported in Sequencing Studies of SARS-CoV-2: Protocol for a Scoping Review and Bibliometric Analysis.SARS-CoV-2测序研究中报告的患者相关元数据:范围综述和文献计量分析方案
JMIR Res Protoc. 2025 Apr 22;14:e58567. doi: 10.2196/58567.
3
Classifying literature mentions of biological pathogens as experimentally studied using natural language processing.使用自然语言处理对文献中提到的生物病原体进行分类,判断其是否经过实验研究。
J Biomed Semantics. 2023 Jan 31;14(1):1. doi: 10.1186/s13326-023-00282-y.
4
High-throughput methods for efficiently building massive phylogenies from natural history collections.利用自然历史标本馆高效构建大规模系统发育树的高通量方法。
Appl Plant Sci. 2021 Feb 27;9(2):e11410. doi: 10.1002/aps3.11410. eCollection 2021 Feb.
5
Linking dimensions of data on global marine animal diversity.关联全球海洋动物多样性数据的各个维度。
Philos Trans R Soc Lond B Biol Sci. 2020 Dec 21;375(1814):20190445. doi: 10.1098/rstb.2019.0445. Epub 2020 Nov 2.
6
Going back to the roots: Evaluating Bayesian phylogeographic models with discrete trait uncertainty.回归根源:用离散特征不确定性评估贝叶斯系统地理学模型。
Infect Genet Evol. 2020 Nov;85:104501. doi: 10.1016/j.meegid.2020.104501. Epub 2020 Aug 13.
7
GeoBoost2: a natural languageprocessing pipeline for GenBank metadata enrichment for virus phylogeography.GeoBoost2:一种用于 GenBank 元数据病毒系统地理学丰富化的自然语言处理管道。
Bioinformatics. 2020 Dec 22;36(20):5120-5121. doi: 10.1093/bioinformatics/btaa647.
8
Bi-directional Recurrent Neural Network Models for Geographic Location Extraction in Biomedical Literature.用于生物医学文献中地理位置提取的双向递归神经网络模型
Pac Symp Biocomput. 2019;24:100-111.
9
Incorporating sampling uncertainty in the geospatial assignment of taxa for virus phylogeography.在病毒系统地理学的分类单元地理空间分配中纳入抽样不确定性。
Virus Evol. 2019 Feb 28;5(1):vey043. doi: 10.1093/ve/vey043. eCollection 2019 Jan.
10
A systematic review of spatial decision support systems in public health informatics supporting the identification of high risk areas for zoonotic disease outbreaks.系统评价公共卫生信息学中的空间决策支持系统,以支持识别动物源性疾病爆发的高风险区域。
Int J Health Geogr. 2018 Oct 30;17(1):38. doi: 10.1186/s12942-018-0157-5.

本文引用的文献

1
A high-precision rule-based extraction system for expanding geospatial metadata in GenBank records.一种用于扩展GenBank记录中地理空间元数据的基于规则的高精度提取系统。
J Am Med Inform Assoc. 2016 Sep;23(5):934-41. doi: 10.1093/jamia/ocv172. Epub 2016 Jan 17.
2
Knowledge-driven geospatial location resolution for phylogeographic models of virus migration.用于病毒迁移系统发育地理学模型的知识驱动型地理空间定位解析
Bioinformatics. 2015 Jun 15;31(12):i348-56. doi: 10.1093/bioinformatics/btv259.
3
Combining phylogeography and spatial epidemiology to uncover predictors of H5N1 influenza A virus diffusion.结合系统发育地理学和空间流行病学以揭示甲型H5N1流感病毒传播的预测因素。
Arch Virol. 2015 Jan;160(1):215-24. doi: 10.1007/s00705-014-2262-5. Epub 2014 Oct 30.
4
Global spread of dengue virus types: mapping the 70 year history.登革热病毒的全球传播:70 年历史的映射。
Trends Microbiol. 2014 Mar;22(3):138-46. doi: 10.1016/j.tim.2013.12.011. Epub 2014 Jan 24.
5
GenBank.GenBank。
Nucleic Acids Res. 2013 Jan;41(Database issue):D36-42. doi: 10.1093/nar/gks1195. Epub 2012 Nov 27.
6
Towards Structuring Unstructured GenBank Metadata for Enhancing Comparative Biological Studies.构建非结构化GenBank元数据以加强比较生物学研究
AMIA Jt Summits Transl Sci Proc. 2011;2011:6-10. Epub 2011 Mar 7.
7
Enhancing phylogeography by improving geographical information from GenBank.从 GenBank 中改进地理信息以增强系统发生地理学。
J Biomed Inform. 2011 Dec;44 Suppl 1(Suppl 1):S44-S47. doi: 10.1016/j.jbi.2011.06.005. Epub 2011 Jun 24.
8
Leveraging biomedical ontologies and annotation services to organize microbiome data from Mammalian hosts.利用生物医学本体和注释服务来整理来自哺乳动物宿主的微生物组数据。
AMIA Annu Symp Proc. 2010 Nov 13;2010:717-21.
9
Influenza A H5N1 immigration is filtered out at some international borders.甲型H5N1流感病毒在一些国际边境被拦截。
PLoS One. 2008 Feb 27;3(2):e1697. doi: 10.1371/journal.pone.0001697.