• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

欧拉蒂格斯:在线性时间内无重复的k-mer集的最小明文表示。

Eulertigs: minimum plain text representation of k-mer sets without repetitions in linear time.

作者信息

Schmidt Sebastian, Alanko Jarno N

机构信息

Department of Computer Science, University of Helsinki, Helsinki, Finland.

Institute of Biology, National University of Sciences, Kiel, Germany.

出版信息

Res Sq. 2023 Feb 16:rs.3.rs-2581995. doi: 10.21203/rs.3.rs-2581995/v1.

DOI:10.21203/rs.3.rs-2581995/v1
PMID:36824947
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9949180/
Abstract

A fundamental operation in computational genomics is to reduce the input sequences to their constituent k-mers. For maximum performance of downstream applications it is important to store the k-mers in small space, while keeping the representation easy and efficient to use (i.e. without k-mer repetitions and in plain text). Recently, heuristics were presented to compute a near-minimum such representation. We present an algorithm to compute a minimum representation in optimal (linear) time and use it to evaluate the existing heuristics. Our algorithm first constructs the de Bruijn graph in linear time and then uses a Eulerian-cycle-based algorithm to compute the minimum representation, in time linear in the size of the output.

摘要

计算基因组学中的一个基本操作是将输入序列简化为其组成的k-mer。为了使下游应用程序具有最佳性能,将k-mer存储在小空间中很重要,同时要使表示易于使用且高效(即没有k-mer重复且为纯文本形式)。最近,有人提出了启发式方法来计算这种接近最小的表示。我们提出了一种算法,可在最佳(线性)时间内计算最小表示,并使用它来评估现有的启发式方法。我们的算法首先在线性时间内构建德布鲁因图,然后使用基于欧拉回路的算法来计算最小表示,其时间与输出大小成线性关系。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/09ba/9949180/adcf1119cbd8/nihpp-rs2581995v1-f0008.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/09ba/9949180/c16537866595/nihpp-rs2581995v1-f0007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/09ba/9949180/adcf1119cbd8/nihpp-rs2581995v1-f0008.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/09ba/9949180/c16537866595/nihpp-rs2581995v1-f0007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/09ba/9949180/adcf1119cbd8/nihpp-rs2581995v1-f0008.jpg