• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

生物压缩模型及其应用。

A biological compression model and its applications.

机构信息

Clayton School of Information Technology, Monash University, Clayton, VIC, 3800, Australia.

出版信息

Adv Exp Med Biol. 2011;696:657-66. doi: 10.1007/978-1-4419-7046-6_67.

DOI:10.1007/978-1-4419-7046-6_67
PMID:21431607
Abstract

A biological compression model, expert model, is presented which is superior to existing compression algorithms in both compression performance and speed. The model is able to compress whole eukaryotic genomes. Most importantly, the model provides a framework for knowledge discovery from biological data. It can be used for repeat element discovery, sequence alignment and phylogenetic analysis. We demonstrate that the model can handle statistically biased sequences and distantly related sequences where conventional knowledge discovery tools often fail.

摘要

提出了一种生物压缩模型,该模型在压缩性能和速度方面均优于现有的压缩算法。该模型能够压缩整个真核生物基因组。最重要的是,该模型为从生物数据中发现知识提供了一个框架。它可用于重复元件发现、序列比对和系统发育分析。我们证明该模型可以处理具有统计偏差的序列和远缘相关的序列,而传统的知识发现工具通常在此类情况下失败。

相似文献

1
A biological compression model and its applications.生物压缩模型及其应用。
Adv Exp Med Biol. 2011;696:657-66. doi: 10.1007/978-1-4419-7046-6_67.
2
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
3
VISTA family of computational tools for comparative analysis of DNA sequences and whole genomes.用于DNA序列和全基因组比较分析的VISTA计算工具家族。
Methods Mol Biol. 2006;338:69-89. doi: 10.1385/1-59745-097-9:69.
4
Automated de novo identification of repeat sequence families in sequenced genomes.在已测序基因组中自动从头识别重复序列家族。
Genome Res. 2002 Aug;12(8):1269-76. doi: 10.1101/gr.88502.
5
Compressive biological sequence analysis and archival in the era of high-throughput sequencing technologies.高通量测序技术时代的压缩生物序列分析与存档
Brief Bioinform. 2014 May;15(3):390-406. doi: 10.1093/bib/bbt088. Epub 2013 Dec 17.
6
DNA sequence compression using the burrows-wheeler transform.使用Burrows-Wheeler变换的DNA序列压缩
Proc IEEE Comput Soc Bioinform Conf. 2002;1:303-13.
7
De novo repeat classification and fragment assembly.从头重复序列分类和片段组装。
Genome Res. 2004 Sep;14(9):1786-96. doi: 10.1101/gr.2395204.
8
Modified HuffBit Compress Algorithm - An Application of R.改进的哈夫比特压缩算法 - R的一种应用
J Integr Bioinform. 2018 Feb 22;15(3):20170057. doi: 10.1515/jib-2017-0057.
9
Multiple genome sequences alignment algorithm based on coding regions.基于编码区的多基因组序列比对算法
Int J Comput Biol Drug Des. 2011;4(2):165-78. doi: 10.1504/IJCBDD.2011.041009. Epub 2011 Jun 28.
10
SeqCompress: an algorithm for biological sequence compression.SeqCompress:一种用于生物序列压缩的算法。
Genomics. 2014 Oct;104(4):225-8. doi: 10.1016/j.ygeno.2014.08.007. Epub 2014 Aug 27.

引用本文的文献

1
Streaming algorithms for identification of pathogens and antibiotic resistance potential from real-time MinION(TM) sequencing.基于实时 MinION(TM)测序的病原体与抗生素耐药性识别流算法。
Gigascience. 2016 Jul 26;5(1):32. doi: 10.1186/s13742-016-0137-2.
2
Inferring short tandem repeat variation from paired-end short reads.从双端短读序列推断短串联重复序列变异。
Nucleic Acids Res. 2014 Feb;42(3):e16. doi: 10.1093/nar/gkt1313. Epub 2013 Dec 17.
3
A genome alignment algorithm based on compression.基于压缩的基因组比对算法。
BMC Bioinformatics. 2010 Dec 16;11:599. doi: 10.1186/1471-2105-11-599.