• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SOPanG:泛基因组上的在线文本搜索。

SOPanG: online text searching over a pan-genome.

机构信息

Institute of Applied Computer Science, Lodz University of Technology, Lódz, Poland.

Faculty of Information Technology, Czech Technical University in Prague, Czechia.

出版信息

Bioinformatics. 2018 Dec 15;34(24):4290-4292. doi: 10.1093/bioinformatics/bty506.

DOI:10.1093/bioinformatics/bty506
PMID:29939210
Abstract

MOTIVATION

The many thousands of high-quality genomes available now-a-days imply a shift from single genome to pan-genomic analyses. A basic algorithmic building brick for such a scenario is online search over a collection of similar texts, a problem with surprisingly few solutions presented so far.

RESULTS

We present SOPanG, a simple tool for exact pattern matching over an elastic-degenerate string, a recently proposed simplified model for the pan-genome. Thanks to bit-parallelism, it achieves pattern matching speeds above 400 MB/s, more than an order of magnitude higher than of other software.

AVAILABILITY AND IMPLEMENTATION

SOPanG is available for free from: https://github.com/MrAlexSee/sopang.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

如今,成千上万的高质量基因组意味着从单个基因组分析向泛基因组分析的转变。这种情况下的基本算法构建模块是对相似文本集合进行在线搜索,到目前为止,提出的解决方案很少。

结果

我们提出了 SOPanG,这是一种用于弹性退化字符串上精确模式匹配的简单工具,这是最近提出的泛基因组简化模型。由于位并行处理,它实现了超过 400MB/s 的模式匹配速度,比其他软件高出一个数量级以上。

可用性和实现

SOPanG 可从以下网址免费获得:https://github.com/MrAlexSee/sopang。

补充信息

补充数据可在 Bioinformatics 在线获得。

相似文献

1
SOPanG: online text searching over a pan-genome.SOPanG:泛基因组上的在线文本搜索。
Bioinformatics. 2018 Dec 15;34(24):4290-4292. doi: 10.1093/bioinformatics/bty506.
2
A space and time-efficient index for the compacted colored de Bruijn graph.一种用于压缩彩色 de Bruijn 图的空间和时间高效索引。
Bioinformatics. 2018 Jul 1;34(13):i169-i177. doi: 10.1093/bioinformatics/bty292.
3
FMtree: a fast locating algorithm of FM-indexes for genomic data.FMtree:一种用于基因组数据的 FM-indexes 的快速定位算法。
Bioinformatics. 2018 Feb 1;34(3):416-424. doi: 10.1093/bioinformatics/btx596.
4
Fast and compact matching statistics analytics.快速且紧凑的匹配统计分析。
Bioinformatics. 2022 Mar 28;38(7):1838-1845. doi: 10.1093/bioinformatics/btac064.
5
Efficient privacy-preserving string search and an application in genomics.高效的隐私保护字符串搜索及其在基因组学中的应用。
Bioinformatics. 2016 Jun 1;32(11):1652-61. doi: 10.1093/bioinformatics/btw050. Epub 2016 Mar 2.
6
NeSSie: a tool for the identification of approximate DNA sequence symmetries.NeSSie:一种用于识别近似 DNA 序列对称性的工具。
Bioinformatics. 2018 Jul 15;34(14):2503-2505. doi: 10.1093/bioinformatics/bty142.
7
sBWT: memory efficient implementation of the hardware-acceleration-friendly Schindler transform for the fast biological sequence mapping.sBWT:用于快速生物序列映射的对硬件加速友好的辛德勒变换的内存高效实现。
Bioinformatics. 2016 Nov 15;32(22):3498-3500. doi: 10.1093/bioinformatics/btw419. Epub 2016 Jul 13.
8
copMEM: finding maximal exact matches via sampling both genomes.copMEM:通过对两个基因组进行采样来寻找最大精确匹配。
Bioinformatics. 2019 Feb 15;35(4):677-678. doi: 10.1093/bioinformatics/bty670.
9
BinDash, software for fast genome distance estimation on a typical personal laptop.BinDash,一款可在普通个人笔记本电脑上快速估算基因组距离的软件。
Bioinformatics. 2019 Feb 15;35(4):671-673. doi: 10.1093/bioinformatics/bty651.
10
ppsPCP: a plant presence/absence variants scanner and pan-genome construction pipeline.ppsPCP:一种植物存在/缺失变体扫描和泛基因组构建管道。
Bioinformatics. 2019 Oct 15;35(20):4156-4158. doi: 10.1093/bioinformatics/btz168.

引用本文的文献

1
A survey of sequence-to-graph mapping algorithms in the pangenome era.泛基因组时代序列到图谱映射算法综述。
Genome Biol. 2025 May 22;26(1):138. doi: 10.1186/s13059-025-03606-6.
2
Pangenome comparison via ED strings.通过编辑距离字符串进行泛基因组比较。
Front Bioinform. 2024 Sep 26;4:1397036. doi: 10.3389/fbinf.2024.1397036. eCollection 2024.
3
IUPACpal: efficient identification of inverted repeats in IUPAC-encoded DNA sequences.IUPACpal:IUPAC 编码 DNA 序列中反向重复序列的有效识别。
BMC Bioinformatics. 2021 Feb 6;22(1):51. doi: 10.1186/s12859-021-03983-2.
4
Pangenome Graphs.泛基因组图谱。
Annu Rev Genomics Hum Genet. 2020 Aug 31;21:139-162. doi: 10.1146/annurev-genom-120219-080406. Epub 2020 May 26.