• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

启发式算法在中值反问题中的应用。

Heuristics for the inversion median problem.

机构信息

Laboratory for Computational Biology and Bioinformatics, EPFL, CH-1015 Lausanne, Switzerland.

出版信息

BMC Bioinformatics. 2010 Jan 18;11 Suppl 1(Suppl 1):S30. doi: 10.1186/1471-2105-11-S1-S30.

DOI:10.1186/1471-2105-11-S1-S30
PMID:20122203
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3009502/
Abstract

BACKGROUND

The study of genome rearrangements has become a mainstay of phylogenetics and comparative genomics. Fundamental in such a study is the median problem: given three genomes find a fourth that minimizes the sum of the evolutionary distances between itself and the given three. Many exact algorithms and heuristics have been developed for the inversion median problem, of which the best known is MGR.

RESULTS

We present a unifying framework for median heuristics, which enables us to clarify existing strategies and to place them in a partial ordering. Analysis of this framework leads to a new insight: the best strategies continue to refer to the input data rather than reducing the problem to smaller instances. Using this insight, we develop a new heuristic for inversion medians that uses input data to the end of its computation and leverages our previous work with DCJ medians. Finally, we present the results of extensive experimentation showing that our new heuristic outperforms all others in accuracy and, especially, in running time: the heuristic typically returns solutions within 1% of optimal and runs in seconds to minutes even on genomes with 25'000 genes--in contrast, MGR can take days on instances of 200 genes and cannot be used beyond 1'000 genes.

CONCLUSION

Finding good rearrangement medians, in particular inversion medians, had long been regarded as the computational bottleneck in whole-genome studies. Our new heuristic for inversion medians, ASM, which dominates all others in our framework, puts that issue to rest by providing near-optimal solutions within seconds to minutes on even the largest genomes.

摘要

背景

基因组重排的研究已成为系统发育学和比较基因组学的主要内容。在这样的研究中,中位数问题是基础:给定三个基因组,找到第四个基因组,使其自身与给定三个基因组之间的进化距离总和最小。已经开发出许多用于反转中位数问题的精确算法和启发式算法,其中最著名的是 MGR。

结果

我们提出了一种中位数启发式算法的统一框架,使我们能够澄清现有的策略,并将它们置于部分排序中。对该框架的分析导致了一个新的见解:最佳策略继续引用输入数据,而不是将问题简化为较小的实例。利用这一见解,我们开发了一种新的反转中位数启发式算法,该算法将输入数据一直用于其计算,并利用我们以前在 DCJ 中位数方面的工作。最后,我们展示了广泛的实验结果,表明我们的新启发式算法在准确性方面优于所有其他算法,尤其是在运行时间方面:该启发式算法通常可以在 1%的最优范围内返回解决方案,并且即使在具有 25000 个基因的基因组上也可以在几秒钟到几分钟内运行,相比之下,MGR 在 200 个基因的实例上可能需要数天的时间,并且不能用于超过 1000 个基因的实例。

结论

寻找良好的重排中位数,特别是反转中位数,长期以来一直被认为是全基因组研究中的计算瓶颈。我们的新反转中位数启发式算法 ASM 在我们的框架中优于所有其他算法,通过在几秒钟到几分钟内提供接近最优的解决方案,解决了这个问题,即使在最大的基因组上也是如此。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/a12a29a59d0a/1471-2105-11-S1-S30-12.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/7bd0ff1e78ee/1471-2105-11-S1-S30-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/393dc9d6fdc5/1471-2105-11-S1-S30-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/e97ccdd22af5/1471-2105-11-S1-S30-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/436e78a728f1/1471-2105-11-S1-S30-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/4b6a8162ddfe/1471-2105-11-S1-S30-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/3c04b73b5f41/1471-2105-11-S1-S30-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/2e861f7a6c4e/1471-2105-11-S1-S30-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/6d1e07296fd0/1471-2105-11-S1-S30-8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/a42eaeafc6f8/1471-2105-11-S1-S30-9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/02b66fa3b461/1471-2105-11-S1-S30-10.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/61a1c0d32a64/1471-2105-11-S1-S30-11.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/a12a29a59d0a/1471-2105-11-S1-S30-12.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/7bd0ff1e78ee/1471-2105-11-S1-S30-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/393dc9d6fdc5/1471-2105-11-S1-S30-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/e97ccdd22af5/1471-2105-11-S1-S30-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/436e78a728f1/1471-2105-11-S1-S30-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/4b6a8162ddfe/1471-2105-11-S1-S30-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/3c04b73b5f41/1471-2105-11-S1-S30-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/2e861f7a6c4e/1471-2105-11-S1-S30-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/6d1e07296fd0/1471-2105-11-S1-S30-8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/a42eaeafc6f8/1471-2105-11-S1-S30-9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/02b66fa3b461/1471-2105-11-S1-S30-10.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/61a1c0d32a64/1471-2105-11-S1-S30-11.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ac3/3009502/a12a29a59d0a/1471-2105-11-S1-S30-12.jpg

相似文献

1
Heuristics for the inversion median problem.启发式算法在中值反问题中的应用。
BMC Bioinformatics. 2010 Jan 18;11 Suppl 1(Suppl 1):S30. doi: 10.1186/1471-2105-11-S1-S30.
2
Using median sets for inferring phylogenetic trees.使用中位数集推断系统发育树。
Bioinformatics. 2007 Jan 15;23(2):e129-35. doi: 10.1093/bioinformatics/btl300.
3
Median Approximations for Genomes Modeled as Matrices.作为矩阵建模的基因组的中位数近似值
Bull Math Biol. 2016 Apr;78(4):786-814. doi: 10.1007/s11538-016-0162-4. Epub 2016 Apr 12.
4
The median problems on linear multichromosomal genomes: graph representation and fast exact solutions.线性多染色体基因组上的中位数问题:图形表示与快速精确解
J Comput Biol. 2010 Sep;17(9):1195-211. doi: 10.1089/cmb.2010.0106.
5
Maximum independent sets of commuting and noninterfering inversions.可交换且互不干扰的逆序的最大独立集。
BMC Bioinformatics. 2009 Jan 30;10 Suppl 1(Suppl 1):S6. doi: 10.1186/1471-2105-10-S1-S6.
6
A GRASP-Based Heuristic for the Sorting by Length-Weighted Inversions Problem.基于 GRASP 的长度-加权倒排问题排序启发式算法。
IEEE/ACM Trans Comput Biol Bioinform. 2018 Mar-Apr;15(2):352-363. doi: 10.1109/TCBB.2015.2474400. Epub 2015 Aug 28.
7
Fast ancestral gene order reconstruction of genomes with unequal gene content.具有不等基因含量的基因组的快速祖先基因顺序重建
BMC Bioinformatics. 2016 Nov 11;17(Suppl 14):413. doi: 10.1186/s12859-016-1261-9.
8
An exact solver for the DCJ median problem.一种用于DCJ中位数问题的精确求解器。
Pac Symp Biocomput. 2009:138-49.
9
Heuristics for Genome Rearrangement Distance With Replicated Genes.含重复基因的基因组重排距离的启发式算法。
IEEE/ACM Trans Comput Biol Bioinform. 2021 Nov-Dec;18(6):2094-2108. doi: 10.1109/TCBB.2021.3095021. Epub 2021 Dec 8.
10
Ancestral genome inference using a genetic algorithm approach.基于遗传算法的祖先基因组推断。
PLoS One. 2013 May 2;8(5):e62156. doi: 10.1371/journal.pone.0062156. Print 2013.

引用本文的文献

1
Models and algorithms for genome rearrangement with positional constraints.具有位置约束的基因组重排模型与算法。
Algorithms Mol Biol. 2016 May 17;11:13. doi: 10.1186/s13015-016-0065-9. eCollection 2016.
2
On pairwise distances and median score of three genomes under DCJ.基于 DCJ 的三个基因组的成对距离和中位数得分。
BMC Bioinformatics. 2012;13 Suppl 19(Suppl 19):S1. doi: 10.1186/1471-2105-13-S19-S1. Epub 2012 Dec 19.

本文引用的文献

1
A fast and exact algorithm for the median of three problem: a graph decomposition approach.一种用于解决三数中位数问题的快速精确算法:一种图分解方法。
J Comput Biol. 2009 Oct;16(10):1369-81. doi: 10.1089/cmb.2009.0087.
2
Inversion-based genomic signatures.基于倒位的基因组特征。
BMC Bioinformatics. 2009 Jan 30;10 Suppl 1(Suppl 1):S7. doi: 10.1186/1471-2105-10-S1-S7.
3
Rearrangements in the chloroplast genomes of mung bean and pea.绿豆和豌豆叶绿体基因组的重排。
Proc Natl Acad Sci U S A. 1981 Sep;78(9):5533-7. doi: 10.1073/pnas.78.9.5533.
4
Inversions in the Third Chromosome of Wild Races of Drosophila Pseudoobscura, and Their Use in the Study of the History of the Species.果蝇拟暗果蝇野生种群第三染色体的倒位及其在物种历史研究中的应用。
Proc Natl Acad Sci U S A. 1936 Jul;22(7):448-50. doi: 10.1073/pnas.22.7.448.
5
Advances in phylogeny reconstruction from gene order and content data.基于基因顺序和内容数据的系统发育重建研究进展。
Methods Enzymol. 2005;395:673-700. doi: 10.1016/S0076-6879(05)95035-0.
6
Genome-scale evolution: reconstructing gene orders in the ancestral species.基因组规模的进化:重建祖先物种中的基因顺序。
Genome Res. 2002 Jan;12(1):26-36.
7
A linear-time algorithm for computing inversion distance between signed permutations with an experimental study.一种用于计算带符号排列之间反转距离的线性时间算法及实验研究
J Comput Biol. 2001;8(5):483-91. doi: 10.1089/106652701753216503.
8
Computational complexity of inferring phylogenies from chromosome inversion data.
J Theor Biol. 1987 Jan 21;124(2):213-8. doi: 10.1016/s0022-5193(87)80263-1.