• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

在大型研究中发现标志物。

Marker discovery in the large.

作者信息

Vieira Mourato Beatriz, Tsers Ivan, Denker Svenja, Klötzl Fabian, Haubold Bernhard

机构信息

Research Group Bioinformatics, Max-Planck-Institute for Evolutionary Biology, 24306 Plön, Schleswig-Holstein, Germany.

Universität zu Lübeck, Lübeck, Schleswig-Holstein, Germany.

出版信息

Bioinform Adv. 2024 Jul 27;4(1):vbae113. doi: 10.1093/bioadv/vbae113. eCollection 2024.

DOI:10.1093/bioadv/vbae113
PMID:39132289
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11310107/
Abstract

MOTIVATION

Markers for diagnostic polymerase chain reactions are routinely constructed by taking regions common to the genomes of a target organism and subtracting the regions found in the targets' closest relatives, their neighbors. This approach is implemented in the published package Fur, which originally required memory proportional to the number of nucleotides in the neighborhood. This does not scale well.

RESULTS

Here, we describe a new version of Fur that only requires memory proportional to the longest neighbor. In spite of its greater memory efficiency, the new Fur remains fast and is accurate. We demonstrate this by applying it to simulated sequences and comparing it to an efficient alternative. Then we use the new Fur to extract markers from 120 reference bacteria. To make this feasible, we also introduce software for automatically finding target and neighbor genomes and for assessing markers. We pick the best primers from the 10 most sequenced reference bacteria and show their excellent sensitivity and specificity.

AVAILABILITY AND IMPLEMENTATION

Fur is available from github.com/evolbioinf/fur, in the Docker image hub.docker.com/r/beatrizvm/mapro, and in the Code Ocean capsule 10.24433/CO.7955947.v1.

摘要

动机

用于诊断聚合酶链反应的标记通常通过获取目标生物体基因组共有的区域,并减去其最接近的亲属(即邻居)基因组中发现的区域来构建。已发布的软件包Fur中实现了这种方法,该软件包最初所需的内存与邻域中的核苷酸数量成正比。这种方法扩展性不佳。

结果

在此,我们描述了Fur的一个新版本,它只需要与最长邻居成正比的内存。尽管新的Fur内存效率更高,但它仍然快速且准确。我们通过将其应用于模拟序列并与一种高效的替代方法进行比较来证明这一点。然后我们使用新的Fur从120种参考细菌中提取标记。为了使其可行,我们还引入了用于自动查找目标和邻居基因组以及评估标记的软件。我们从测序最多的10种参考细菌中挑选出最佳引物,并展示了它们出色的灵敏度和特异性。

可用性和实现方式

Fur可从github.com/evolbioinf/fur获取,也可在Docker镜像hub.docker.com/r/beatrizvm/mapro以及Code Ocean胶囊10.24433/CO.7955947.v1中获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/a1a927b55f3c/vbae113f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/ae225c5e74e7/vbae113f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/1bc5112ec680/vbae113f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/fe9fd14d60fa/vbae113f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/a1a927b55f3c/vbae113f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/ae225c5e74e7/vbae113f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/1bc5112ec680/vbae113f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/fe9fd14d60fa/vbae113f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ab6b/11310107/a1a927b55f3c/vbae113f4.jpg

相似文献

1
Marker discovery in the large.在大型研究中发现标志物。
Bioinform Adv. 2024 Jul 27;4(1):vbae113. doi: 10.1093/bioadv/vbae113. eCollection 2024.
2
Fur: Find unique genomic regions for diagnostic PCR.Fur:找到用于诊断性聚合酶链反应的独特基因组区域。
Bioinformatics. 2021 Aug 9;37(15):2081-2087. doi: 10.1093/bioinformatics/btab059.
3
ICBdocker: a Docker image for proteome annotation and visualization.ICBdocker:一个用于蛋白质组注释和可视化的 Docker 镜像。
Bioinformatics. 2018 Nov 15;34(22):3937-3938. doi: 10.1093/bioinformatics/bty493.
4
Cuttlefish: fast, parallel and low-memory compaction of de Bruijn graphs from large-scale genome collections.乌贼算法:从大规模基因组集合中快速、并行且低内存消耗的 de Bruijn 图压缩。
Bioinformatics. 2021 Jul 12;37(Suppl_1):i177-i186. doi: 10.1093/bioinformatics/btab309.
5
High-complexity regions in mammalian genomes are enriched for developmental genes.哺乳动物基因组中的高复杂度区域富含发育基因。
Bioinformatics. 2019 Jun 1;35(11):1813-1819. doi: 10.1093/bioinformatics/bty922.
6
dbgap2x: an R package to explore and extract data from the database of Genotypes and Phenotypes (dbGaP).dbgap2x:一个用于从基因型和表型数据库(dbGaP)中探索和提取数据的 R 包。
Bioinformatics. 2020 Feb 15;36(4):1305-1306. doi: 10.1093/bioinformatics/btz680.
7
Phylonium: fast estimation of evolutionary distances from large samples of similar genomes.Phylonium:从大量相似基因组中快速估计进化距离。
Bioinformatics. 2020 Apr 1;36(7):2040-2046. doi: 10.1093/bioinformatics/btz903.
8
FastRemap: a tool for quickly remapping reads between genome assemblies.FastRemap:一种快速在基因组组装之间重新映射读取的工具。
Bioinformatics. 2022 Sep 30;38(19):4633-4635. doi: 10.1093/bioinformatics/btac554.
9
ORCA: a comprehensive bioinformatics container environment for education and research.ORCA:一个全面的生物信息学容器环境,用于教育和研究。
Bioinformatics. 2019 Nov 1;35(21):4448-4450. doi: 10.1093/bioinformatics/btz278.
10
Discovery of tandem and interspersed segmental duplications using high-throughput sequencing.利用高通量测序发现串联和散在的片段重复。
Bioinformatics. 2019 Oct 15;35(20):3923-3930. doi: 10.1093/bioinformatics/btz237.

引用本文的文献

1
Fast detection of unique genomic regions.独特基因组区域的快速检测。
Comput Struct Biotechnol J. 2025 Feb 27;27:843-850. doi: 10.1016/j.csbj.2025.02.025. eCollection 2025.

本文引用的文献

1
Suffix sorting via matching statistics.通过匹配统计进行后缀排序。
Algorithms Mol Biol. 2024 Mar 12;19(1):11. doi: 10.1186/s13015-023-00245-z.
2
Development of Loop-Mediated Isothermal Amplification Assays for the Rapid and Accurate Diagnosis of for Field Applications.用于现场应用的快速准确诊断的环介导等温扩增检测方法的开发。
Plant Dis. 2024 Jun;108(6):1461-1469. doi: 10.1094/PDIS-10-23-2101-SR. Epub 2024 May 22.
3
primerJinn: a tool for rationally designing multiplex PCR primer sets for amplicon sequencing and performing in silico PCR.
引物精灵(primerJinn):一种用于设计扩增子测序多重 PCR 引物对的工具,并可进行计算机 PCR 分析。
BMC Bioinformatics. 2023 Dec 12;24(1):468. doi: 10.1186/s12859-023-05609-1.
4
Utilization of a New Hundred-Genomes Pipeline to Design a Rapid Duplex LAMP Detection Assay for and in Tomato.利用新的百基因组管道设计一种用于番茄中 和 的快速双联环介导等温扩增检测方法。
Plant Dis. 2023 Jun;107(6):1822-1828. doi: 10.1094/PDIS-05-22-1098-RE. Epub 2023 Jun 1.
5
Fast and compact matching statistics analytics.快速且紧凑的匹配统计分析。
Bioinformatics. 2022 Mar 28;38(7):1838-1845. doi: 10.1093/bioinformatics/btac064.
6
MONI: A Pangenomic Index for Finding Maximal Exact Matches.MONI:用于寻找最大精确匹配的泛基因组索引。
J Comput Biol. 2022 Feb;29(2):169-187. doi: 10.1089/cmb.2021.0290. Epub 2022 Jan 17.
7
KEC: unique sequence search by K-mer exclusion.KEC:通过k-mer排除进行独特序列搜索。
Bioinformatics. 2021 Oct 11;37(19):3349-3350. doi: 10.1093/bioinformatics/btab196.
8
Fur: Find unique genomic regions for diagnostic PCR.Fur:找到用于诊断性聚合酶链反应的独特基因组区域。
Bioinformatics. 2021 Aug 9;37(15):2081-2087. doi: 10.1093/bioinformatics/btab059.
9
Appendix Q: Recommendations for Developing Molecular Assays for Microbial Pathogen Detection Using Modern In Silico Approaches.附录Q:使用现代计算机方法开发用于微生物病原体检测的分子检测方法的建议。
J AOAC Int. 2020 Jul 1;103(4):882-899. doi: 10.1093/jaoacint/qsaa045.
10
NCBI Taxonomy: a comprehensive update on curation, resources and tools.NCBI 分类学:在管理、资源和工具方面的全面更新。
Database (Oxford). 2020 Jan 1;2020. doi: 10.1093/database/baaa062.