• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

关于《ERGC:一种高效的参考基因组压缩算法》的评论

Comment on: 'ERGC: an efficient referential genome compression algorithm'.

作者信息

Deorowicz Sebastian, Grabowski Szymon, Ochoa Idoia, Hernaez Mikel, Weissman Tsachy

机构信息

Institute of Informatics, Silesian University of Technology, Akademicka 16, Gliwice, 44-100 Poland.

Institute of Applied Computer Science, Lodz University of Technology, Al. Politechniki 11, 90-924 Łódź, Poland and.

出版信息

Bioinformatics. 2016 Apr 1;32(7):1115-7. doi: 10.1093/bioinformatics/btv704. Epub 2015 Nov 28.

DOI:10.1093/bioinformatics/btv704
PMID:26615213
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4907388/
Abstract

MOTIVATION

Data compression is crucial in effective handling of genomic data. Among several recently published algorithms, ERGC seems to be surprisingly good, easily beating all of the competitors.

RESULTS

We evaluated ERGC and the previously proposed algorithms GDC and iDoComp, which are the ones used in the original paper for comparison, on a wide data set including 12 assemblies of human genome (instead of only four of them in the original paper). ERGC wins only when one of the genomes (referential or target) contains mixed-cased letters (which is the case for only the two Korean genomes). In all other cases ERGC is on average an order of magnitude worse than GDC and iDoComp.

CONTACT

sebastian.deorowicz@polsl.pl, iochoa@stanford.edu

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

数据压缩对于有效处理基因组数据至关重要。在最近发表的几种算法中,ERGC似乎出奇地好,轻松击败了所有竞争对手。

结果

我们在一个包含12个人类基因组组装(而不是原始论文中的仅4个)的广泛数据集上评估了ERGC以及先前提出的算法GDC和iDoComp,原始论文中使用这些算法进行比较。只有当其中一个基因组(参考基因组或目标基因组)包含大小写混合字母时(只有两个韩国基因组是这种情况),ERGC才会获胜。在所有其他情况下,ERGC平均比GDC和iDoComp差一个数量级。

联系方式

sebastian.deorowicz@polsl.pl,iochoa@stanford.edu

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
Comment on: 'ERGC: an efficient referential genome compression algorithm'.关于《ERGC:一种高效的参考基因组压缩算法》的评论
Bioinformatics. 2016 Apr 1;32(7):1115-7. doi: 10.1093/bioinformatics/btv704. Epub 2015 Nov 28.
2
Robust relative compression of genomes with random access.具有随机访问的基因组的稳健相对压缩。
Bioinformatics. 2011 Nov 1;27(21):2979-86. doi: 10.1093/bioinformatics/btr505. Epub 2011 Sep 5.
3
ERGC: an efficient referential genome compression algorithm.ERGC:一种高效的参考基因组压缩算法。
Bioinformatics. 2015 Nov 1;31(21):3468-75. doi: 10.1093/bioinformatics/btv399. Epub 2015 Jul 2.
4
Authors' response to 'Comment on: ERGC: An efficient Referential Genome Compression Algorithm'.作者对《关于“ERGC:一种高效的参考基因组压缩算法”的评论》的回应。
Bioinformatics. 2016 Apr 1;32(7):1118-9. doi: 10.1093/bioinformatics/btv720. Epub 2015 Dec 31.
5
iDoComp: a compression scheme for assembled genomes.iDoComp:一种用于组装基因组的压缩方案。
Bioinformatics. 2015 Mar 1;31(5):626-33. doi: 10.1093/bioinformatics/btu698. Epub 2014 Oct 24.
6
Disk-based compression of data from genome sequencing.基于磁盘的数据压缩技术在基因组测序中的应用。
Bioinformatics. 2015 May 1;31(9):1389-95. doi: 10.1093/bioinformatics/btu844. Epub 2014 Dec 22.
7
DSRC 2--Industry-oriented compression of FASTQ files.DSRC 2--面向 FASTQ 文件的行业导向压缩。
Bioinformatics. 2014 Aug 1;30(15):2213-5. doi: 10.1093/bioinformatics/btu208. Epub 2014 Apr 18.
8
Genome compression: a novel approach for large collections.基因组压缩:一种用于大型数据集的新方法。
Bioinformatics. 2013 Oct 15;29(20):2572-8. doi: 10.1093/bioinformatics/btt460. Epub 2013 Aug 21.
9
GDC 2: Compression of large collections of genomes.基因组数据压缩2:大型基因组集合的压缩
Sci Rep. 2015 Jun 25;5:11565. doi: 10.1038/srep11565.
10
NRGC: a novel referential genome compression algorithm.NRGC:一种新型的参考基因组压缩算法。
Bioinformatics. 2016 Nov 15;32(22):3405-3412. doi: 10.1093/bioinformatics/btw505. Epub 2016 Aug 2.

引用本文的文献

1
Reference-based genome compression using the longest matched substrings with parallelization consideration.基于参考的最长匹配子串基因组压缩及其并行化考虑。
BMC Bioinformatics. 2023 Sep 30;24(1):369. doi: 10.1186/s12859-023-05500-z.
2
Vertical lossless genomic data compression tools for assembled genomes: A systematic literature review.用于组装基因组的垂直无损基因组数据压缩工具:系统文献回顾。
PLoS One. 2020 May 26;15(5):e0232942. doi: 10.1371/journal.pone.0232942. eCollection 2020.

本文引用的文献

1
ERGC: an efficient referential genome compression algorithm.ERGC:一种高效的参考基因组压缩算法。
Bioinformatics. 2015 Nov 1;31(21):3468-75. doi: 10.1093/bioinformatics/btv399. Epub 2015 Jul 2.
2
GDC 2: Compression of large collections of genomes.基因组数据压缩2:大型基因组集合的压缩
Sci Rep. 2015 Jun 25;5:11565. doi: 10.1038/srep11565.
3
iDoComp: a compression scheme for assembled genomes.iDoComp:一种用于组装基因组的压缩方案。
Bioinformatics. 2015 Mar 1;31(5):626-33. doi: 10.1093/bioinformatics/btu698. Epub 2014 Oct 24.
4
FRESCO: Referential compression of highly similar sequences.FRESCO:高度相似序列的参考压缩
IEEE/ACM Trans Comput Biol Bioinform. 2013 Sep-Oct;10(5):1275-88. doi: 10.1109/tcbb.2013.122.
5
Robust relative compression of genomes with random access.具有随机访问的基因组的稳健相对压缩。
Bioinformatics. 2011 Nov 1;27(21):2979-86. doi: 10.1093/bioinformatics/btr505. Epub 2011 Sep 5.