• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

BioMAJ2Galaxy:使用BioMAJ在Galaxy中自动更新参考数据。

BioMAJ2Galaxy: automatic update of reference data in Galaxy using BioMAJ.

作者信息

Bretaudeau Anthony, Monjeaud Cyril, Le Bras Yvan, Legeai Fabrice, Collin Olivier

机构信息

INRA, UMR Institut de Génétique, Environnement et Protection des Plantes (IGEPP), BioInformatics Platform for Agroecosystems Arthropods (BIPAA), Campus Beaulieu, Rennes, 35042 France ; INRIA, IRISA, GenOuest Core Facility, Campus de Beaulieu, Rennes, 35042 France.

INRIA, IRISA, GenOuest Core Facility, Campus de Beaulieu, Rennes, 35042 France.

出版信息

Gigascience. 2015 May 9;4:22. doi: 10.1186/s13742-015-0063-8. eCollection 2015.

DOI:10.1186/s13742-015-0063-8
PMID:25960870
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4425870/
Abstract

BACKGROUND

Many bioinformatics tools use reference data, such as genome assemblies or sequence databanks. Galaxy offers multiple ways to give access to this data through its web interface. However, the process of adding new reference data was customarily manual and time consuming, even more so when this data needed to be indexed in a variety of formats (e.g. Blast, Bowtie, BWA, or 2bit). BioMAJ is a widely used and stable software that is designed to automate the download and transformation of data from various sources. This data can be used directly from the command line, in more complex systems, such as Mobyle, or by using a REST API.

FINDINGS

To ease the process of giving access to reference data in Galaxy, we have developed the BioMAJ2Galaxy module, which enables the gap between BioMAJ and Galaxy to be bridged. With this module, it is now possible to configure BioMAJ to automatically download some reference data, to then convert and/or index it in various formats, and then make this data available in a Galaxy server using data libraries or data managers.

CONCLUSIONS

The developments presented in this paper allow us to integrate the reference data in Galaxy in an automatic, reliable, and diskspace-saving way. The code is freely available on the GenOuest GitHub account (https://github.com/genouest/biomaj2galaxy).

摘要

背景

许多生物信息学工具使用参考数据,如基因组组装或序列数据库。Galaxy提供了多种通过其网页界面访问这些数据的方式。然而,添加新参考数据的过程通常是手动的且耗时,当这些数据需要以多种格式(如Blast、Bowtie、BWA或2bit)进行索引时更是如此。BioMAJ是一个广泛使用且稳定的软件,旨在自动化从各种来源下载和转换数据。此数据可直接从命令行使用,在更复杂的系统(如Mobyle)中使用,或通过使用REST API使用。

研究结果

为简化在Galaxy中访问参考数据的过程,我们开发了BioMAJ2Galaxy模块,它能够弥合BioMAJ与Galaxy之间的差距。借助此模块,现在可以配置BioMAJ自动下载一些参考数据,然后将其转换和/或索引为各种格式,接着使用数据库或数据管理器在Galaxy服务器中提供此数据。

结论

本文介绍的进展使我们能够以自动、可靠且节省磁盘空间的方式在Galaxy中整合参考数据。代码可在GenOuest GitHub账户(https://github.com/genouest/biomaj2galaxy)上免费获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0af/4425870/7c8be890d397/13742_2015_63_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0af/4425870/4c3f2fc77bf4/13742_2015_63_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0af/4425870/7c8be890d397/13742_2015_63_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0af/4425870/4c3f2fc77bf4/13742_2015_63_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0af/4425870/7c8be890d397/13742_2015_63_Fig2_HTML.jpg

相似文献

1
BioMAJ2Galaxy: automatic update of reference data in Galaxy using BioMAJ.BioMAJ2Galaxy:使用BioMAJ在Galaxy中自动更新参考数据。
Gigascience. 2015 May 9;4:22. doi: 10.1186/s13742-015-0063-8. eCollection 2015.
2
BioMAJ: a flexible framework for databanks synchronization and processing.BioMAJ:一个用于数据库同步与处理的灵活框架。
Bioinformatics. 2008 Aug 15;24(16):1823-5. doi: 10.1093/bioinformatics/btn325. Epub 2008 Jun 30.
3
ReGaTE: Registration of Galaxy Tools in Elixir.ReGaTE:Elixir中Galaxy工具的注册。
Gigascience. 2017 Jun 1;6(6):1-4. doi: 10.1093/gigascience/gix022.
4
Sequence database versioning for command line and Galaxy bioinformatics servers.用于命令行和Galaxy生物信息学服务器的序列数据库版本控制。
Bioinformatics. 2016 Apr 15;32(8):1275-7. doi: 10.1093/bioinformatics/btv724. Epub 2015 Dec 12.
5
BioBlend.objects: metacomputing with Galaxy.BioBlend对象:使用Galaxy进行元计算。
Bioinformatics. 2014 Oct;30(19):2816-7. doi: 10.1093/bioinformatics/btu386. Epub 2014 Jun 12.
6
Expanding the Galaxy's reference data.扩展星系的参考数据。
Bioinform Adv. 2022 Apr 29;2(1):vbac030. doi: 10.1093/bioadv/vbac030. eCollection 2022.
7
The missing graphical user interface for genomics.基因组学缺失的图形用户界面。
Genome Biol. 2010;11(8):128. doi: 10.1186/gb-2010-11-8-128. Epub 2010 Aug 25.
8
blend4php: a PHP API for galaxy.blend4php:用于Galaxy的PHP应用程序编程接口。
Database (Oxford). 2017 Jan 10;2017. doi: 10.1093/database/baw154. Print 2017.
9
APOSTL: An Interactive Galaxy Pipeline for Reproducible Analysis of Affinity Proteomics Data.APOSTL:用于亲和蛋白质组学数据可重复分析的交互式星系管道
J Proteome Res. 2016 Dec 2;15(12):4747-4754. doi: 10.1021/acs.jproteome.6b00660. Epub 2016 Oct 21.
10
Galaxy HiCExplorer: a web server for reproducible Hi-C data analysis, quality control and visualization.Galaxy HiCExplorer:一个用于可重现的 Hi-C 数据分析、质量控制和可视化的网络服务器。
Nucleic Acids Res. 2018 Jul 2;46(W1):W11-W16. doi: 10.1093/nar/gky504.

引用本文的文献

1
blend4php: a PHP API for galaxy.blend4php:用于Galaxy的PHP应用程序编程接口。
Database (Oxford). 2017 Jan 10;2017. doi: 10.1093/database/baw154. Print 2017.

本文引用的文献

1
Wrangling Galaxy's reference data.整理星系的参考数据。
Bioinformatics. 2014 Jul 1;30(13):1917-9. doi: 10.1093/bioinformatics/btu119. Epub 2014 Feb 28.
2
Web-based visual analysis for high-throughput genomics.基于网络的高通量基因组学可视化分析。
BMC Genomics. 2013 Jun 13;14:397. doi: 10.1186/1471-2164-14-397.
3
BioBlend: automating pipeline analyses within Galaxy and CloudMan.BioBlend:在 Galaxy 和 CloudMan 内自动化管道分析。
Bioinformatics. 2013 Jul 1;29(13):1685-6. doi: 10.1093/bioinformatics/btt199. Epub 2013 Apr 28.
4
GenBank.GenBank。
Nucleic Acids Res. 2013 Jan;41(Database issue):D36-42. doi: 10.1093/nar/gks1195. Epub 2012 Nov 27.
5
Fast gapped-read alignment with Bowtie 2.快速缺口读对准与 Bowtie 2。
Nat Methods. 2012 Mar 4;9(4):357-9. doi: 10.1038/nmeth.1923.
6
Galaxy: a comprehensive approach for supporting accessible, reproducible, and transparent computational research in the life sciences.Galaxy:一种支持生命科学领域可访问、可重现和透明计算研究的综合方法。
Genome Biol. 2010;11(8):R86. doi: 10.1186/gb-2010-11-8-r86. Epub 2010 Aug 25.
7
Galaxy: a web-based genome analysis tool for experimentalists.Galaxy:一款面向实验人员的基于网络的基因组分析工具。
Curr Protoc Mol Biol. 2010 Jan;Chapter 19:Unit 19.10.1-21. doi: 10.1002/0471142727.mb1910s89.
8
BLAST+: architecture and applications.BLAST+:体系结构与应用。
BMC Bioinformatics. 2009 Dec 15;10:421. doi: 10.1186/1471-2105-10-421.
9
Mobyle: a new full web bioinformatics framework.Mobyle:一个全新的全网络生物信息学框架。
Bioinformatics. 2009 Nov 15;25(22):3005-11. doi: 10.1093/bioinformatics/btp493. Epub 2009 Aug 17.
10
Fast and accurate short read alignment with Burrows-Wheeler transform.使用Burrows-Wheeler变换进行快速准确的短读比对。
Bioinformatics. 2009 Jul 15;25(14):1754-60. doi: 10.1093/bioinformatics/btp324. Epub 2009 May 18.