• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于分析海量基因组数据集的生物信息学服务。

Bioinformatics services for analyzing massive genomic datasets.

作者信息

Ko Gunhwan, Kim Pan-Gyu, Cho Youngbum, Jeong Seongmun, Kim Jae-Yoon, Kim Kyoung Hyoun, Lee Ho-Yeon, Han Jiyeon, Yu Namhee, Ham Seokjin, Jang Insoon, Kang Byunghee, Shin Sunguk, Kim Lian, Lee Seung-Won, Nam Dougu, Kim Jihyun F, Kim Namshin, Kim Seon-Young, Lee Sanghyuk, Roh Tae-Young, Lee Byungwook

机构信息

Korea Bioinformation Center (KOBIC), KRIBB, Daejeon 34141, Korea.

Genome Editing Research Center, KRIBB, Daejeon 34141, Korea.

出版信息

Genomics Inform. 2020 Mar;18(1):e8. doi: 10.5808/GI.2020.18.1.e8. Epub 2020 Mar 31.

DOI:10.5808/GI.2020.18.1.e8
PMID:32224841
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7120352/
Abstract

The explosive growth of next-generation sequencing data has resulted in ultra-large-scale datasets and ensuing computational problems. In Korea, the amount of genomic data has been increasing rapidly in the recent years. Leveraging these big data requires researchers to use large-scale computational resources and analysis pipelines. A promising solution for addressing this computational challenge is cloud computing, where CPUs, memory, storage, and programs are accessible in the form of virtual machines. Here, we present a cloud computing-based system, Bio-Express, that provides user-friendly, cost-effective analysis of massive genomic datasets. Bio-Express is loaded with predefined multi-omics data analysis pipelines, which are divided into genome, transcriptome, epigenome, and metagenome pipelines. Users can employ predefined pipelines or create a new pipeline for analyzing their own omics data. We also developed several web-based services for facilitating downstream analysis of genome data. Bio-Express web service is freely available at https://www.bioexpress.re.kr/.

摘要

下一代测序数据的爆炸式增长产生了超大规模数据集以及随之而来的计算问题。在韩国,近年来基因组数据量一直在迅速增加。利用这些大数据要求研究人员使用大规模计算资源和分析流程。应对这一计算挑战的一个有前景的解决方案是云计算,在云计算中,中央处理器、内存、存储和程序都可以通过虚拟机的形式进行访问。在此,我们展示了一个基于云计算的系统Bio-Express,它能对海量基因组数据集进行用户友好且经济高效的分析。Bio-Express加载了预定义的多组学数据分析流程,这些流程分为基因组、转录组、表观基因组和宏基因组流程。用户可以使用预定义流程或创建新的流程来分析自己的组学数据。我们还开发了几个基于网络的服务,以促进基因组数据的下游分析。Bio-Express网络服务可在https://www.bioexpress.re.kr/免费获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/60857372f3e3/gi-2020-18-1-e8f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/9df55cb09829/gi-2020-18-1-e8f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/9a0c45beff09/gi-2020-18-1-e8f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/6a98ad32388d/gi-2020-18-1-e8f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/a140005e2efe/gi-2020-18-1-e8f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/60857372f3e3/gi-2020-18-1-e8f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/9df55cb09829/gi-2020-18-1-e8f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/9a0c45beff09/gi-2020-18-1-e8f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/6a98ad32388d/gi-2020-18-1-e8f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/a140005e2efe/gi-2020-18-1-e8f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7577/7120352/60857372f3e3/gi-2020-18-1-e8f5.jpg

相似文献

1
Bioinformatics services for analyzing massive genomic datasets.用于分析海量基因组数据集的生物信息学服务。
Genomics Inform. 2020 Mar;18(1):e8. doi: 10.5808/GI.2020.18.1.e8. Epub 2020 Mar 31.
2
Closha: bioinformatics workflow system for the analysis of massive sequencing data.Closha:用于大规模测序数据分析的生物信息学工作流系统。
BMC Bioinformatics. 2018 Feb 19;19(Suppl 1):43. doi: 10.1186/s12859-018-2019-3.
3
A (fire)cloud-based DNA methylation data preprocessing and quality control platform.一个基于云计算的 DNA 甲基化数据预处理和质量控制平台。
BMC Bioinformatics. 2019 Mar 29;20(1):160. doi: 10.1186/s12859-019-2750-4.
4
MC-GenomeKey: a multicloud system for the detection and annotation of genomic variants.MC-GenomeKey:一种用于检测和注释基因组变异的多云系统。
BMC Bioinformatics. 2017 Jan 20;18(1):49. doi: 10.1186/s12859-016-1454-2.
5
BAMSI: a multi-cloud service for scalable distributed filtering of massive genome data.BAMSI:一个用于大规模基因组数据可扩展分布式过滤的多云服务。
BMC Bioinformatics. 2018 Jun 26;19(1):240. doi: 10.1186/s12859-018-2241-z.
6
Resources and costs for microbial sequence analysis evaluated using virtual machines and cloud computing.利用虚拟机和云计算评估微生物序列分析的资源和成本。
PLoS One. 2011;6(10):e26624. doi: 10.1371/journal.pone.0026624. Epub 2011 Oct 19.
7
Cloud Computing Enabled Big Multi-Omics Data Analytics.基于云计算的大型多组学数据分析
Bioinform Biol Insights. 2021 Jul 28;15:11779322211035921. doi: 10.1177/11779322211035921. eCollection 2021.
8
Bio and health informatics meets cloud : BioVLab as an example.生物与健康信息学与云的相遇:以 BioVLab 为例。
Health Inf Sci Syst. 2013 Feb 4;1:6. doi: 10.1186/2047-2501-1-6. eCollection 2013.
9
Personalized cloud-based bioinformatics services for research and education: use cases and the elasticHPC package.个性化基于云的生物信息学服务用于研究和教育:用例和 elasticHPC 包。
BMC Bioinformatics. 2012;13 Suppl 17(Suppl 17):S22. doi: 10.1186/1471-2105-13-S17-S22. Epub 2012 Dec 13.
10
JMS: An Open Source Workflow Management System and Web-Based Cluster Front-End for High Performance Computing.JMS:一个用于高性能计算的开源工作流管理系统和基于网络的集群前端。
PLoS One. 2015 Aug 17;10(8):e0134273. doi: 10.1371/journal.pone.0134273. eCollection 2015.

引用本文的文献

1
Closha 2.0: a bio-workflow design system for massive genome data analysis on high performance cluster infrastructure.Closha 2.0:一个用于高性能集群基础设施上大规模基因组数据分析的生物工作流设计系统。
BMC Bioinformatics. 2024 Nov 12;25(1):353. doi: 10.1186/s12859-024-05963-8.
2
KoNA: Korean Nucleotide Archive as A New Data Repository for Nucleotide Sequence Data.KoNA:韩国核苷酸档案库作为核苷酸序列数据的新数据存储库。
Genomics Proteomics Bioinformatics. 2024 May 9;22(1). doi: 10.1093/gpbjnl/qzae017.
3
The Innovative Informatics Approaches of High-Throughput Technologies in Livestock: Spearheading the Sustainability and Resiliency of Agrigenomics Research.

本文引用的文献

1
ChimerDB 4.0: an updated and expanded database of fusion genes.ChimerDB 4.0:一个更新和扩展的融合基因数据库。
Nucleic Acids Res. 2020 Jan 8;48(D1):D817-D824. doi: 10.1093/nar/gkz1013.
2
BiomeNet: a database for construction and analysis of functional interaction networks for any species with a sequenced genome.生物网络数据库:一个用于构建和分析任何具有测序基因组的物种的功能相互作用网络的数据库。
Bioinformatics. 2020 Mar 1;36(5):1584-1589. doi: 10.1093/bioinformatics/btz776.
3
Sequencing Technologies and Analyses: Where Have We Been and Where Are We Going?
家畜高通量技术的创新信息学方法:引领农业基因组学研究的可持续性和适应性。
Life (Basel). 2022 Nov 15;12(11):1893. doi: 10.3390/life12111893.
测序技术与分析:我们从何而来,又将走向何方?
iScience. 2019 Aug 30;18:37-41. doi: 10.1016/j.isci.2019.06.035. Epub 2019 Aug 15.
4
GScluster: network-weighted gene-set clustering analysis.GScluster:网络加权基因集聚类分析。
BMC Genomics. 2019 May 9;20(1):352. doi: 10.1186/s12864-019-5738-6.
5
Cloud computing applications for biomedical science: A perspective.云计算在生物医学科学中的应用:一个视角。
PLoS Comput Biol. 2018 Jun 14;14(6):e1006144. doi: 10.1371/journal.pcbi.1006144. eCollection 2018 Jun.
6
GEMiCCL: mining genotype and expression data of cancer cell lines with elaborate visualization.GEMiCCL:利用精心设计的可视化技术挖掘癌症细胞系的基因型和表达数据。
Database (Oxford). 2018 Jan 1;2018. doi: 10.1093/database/bay041.
7
Efficient pathway enrichment and network analysis of GWAS summary data using GSA-SNP2.利用 GSA-SNP2 对 GWAS 汇总数据进行有效的通路富集和网络分析。
Nucleic Acids Res. 2018 Jun 1;46(10):e60. doi: 10.1093/nar/gky175.
8
Cloud computing for genomic data analysis and collaboration.云计算在基因组数据分析和协作中的应用。
Nat Rev Genet. 2018 Apr;19(4):208-219. doi: 10.1038/nrg.2017.113. Epub 2018 Jan 30.
9
3DIV: A 3D-genome Interaction Viewer and database.3DIV:一个三维基因组互作浏览器和数据库。
Nucleic Acids Res. 2018 Jan 4;46(D1):D52-D57. doi: 10.1093/nar/gkx1017.
10
SEXCMD: Development and validation of sex marker sequences for whole-exome/genome and RNA sequencing.SEXCMD:用于全外显子组/基因组和RNA测序的性别标记序列的开发与验证
PLoS One. 2017 Sep 8;12(9):e0184087. doi: 10.1371/journal.pone.0184087. eCollection 2017.