• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于DCJ距离的精确且快速的SAT公式化方法。

An Exact and Fast SAT Formulation for the DCJ Distance.

作者信息

Sarnaik Aaryan M, Chen Ke, Diaz Austin, Shao Mingfu

机构信息

Department of Computer Science and Engineering, The Pennsylvania State University, University Park, PA 16802, USA.

Huck Institutes of the Life Sciences, The Pennsylvania State University, University Park, PA 16802, USA.

出版信息

bioRxiv. 2024 Nov 8:2024.11.05.622153. doi: 10.1101/2024.11.05.622153.

DOI:10.1101/2024.11.05.622153
PMID:39574685
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11580896/
Abstract

Reducing into a satisfiability (SAT) formulation has been proven effective in solving certain NP-hard problems. In this work, we extend this research by presenting a novel SAT formulation for computing the double-cut-and-join (DCJ) distance between two genomes with duplicate genes. The DCJ distance serves as a crucial metric in studying genome rearrangement. Previous work achieved an exact solution by transforming it into a maximum cycle decomposition (MCD) problem on the corresponding adjacency graph of two genomes, followed by reducing this problem into an integer linear programming (ILP) formulation. Using both simulated datasets and real genomic datasets, we firmly conclude that the SAT-based method scales much better and runs faster than using ILP, being able to solve a whole new range of instances which the ILP-based method cannot solve in a reasonable amount of time. This underscores the SAT-based approach as a versatile and more powerful alternative to ILP, with promising implications for broader applications in computational biology.

摘要

事实证明,将问题规约为可满足性(SAT)公式在解决某些NP难问题方面是有效的。在这项工作中,我们通过提出一种新颖的SAT公式来扩展这项研究,该公式用于计算具有重复基因的两个基因组之间的双切割连接(DCJ)距离。DCJ距离是研究基因组重排的关键指标。先前的工作通过将其转化为两个基因组相应邻接图上的最大循环分解(MCD)问题,然后将该问题规约为整数线性规划(ILP)公式,从而得到了精确解。使用模拟数据集和真实基因组数据集,我们坚定地得出结论:基于SAT的方法比使用ILP的方法扩展性更好、运行速度更快,能够解决一系列基于ILP的方法在合理时间内无法解决的全新实例。这突出了基于SAT的方法作为ILP的一种通用且更强大的替代方法,对计算生物学中的更广泛应用具有潜在的意义。

相似文献

1
An Exact and Fast SAT Formulation for the DCJ Distance.一种用于DCJ距离的精确且快速的SAT公式化方法。
bioRxiv. 2024 Nov 8:2024.11.05.622153. doi: 10.1101/2024.11.05.622153.
2
An Exact Algorithm to Compute the Double-Cut-and-Join Distance for Genomes with Duplicate Genes.一种用于计算具有重复基因的基因组的双切割连接距离的精确算法。
J Comput Biol. 2015 May;22(5):425-35. doi: 10.1089/cmb.2014.0096. Epub 2014 Dec 17.
3
Recombinations, chains and caps: resolving problems with the DCJ-indel model.重组、链与端粒帽:用DCJ-插入缺失模型解决问题
Algorithms Mol Biol. 2024 Feb 27;19(1):8. doi: 10.1186/s13015-024-00253-7.
4
Computing the Rearrangement Distance of Natural Genomes.计算自然基因组的重排距离。
J Comput Biol. 2021 Apr;28(4):410-431. doi: 10.1089/cmb.2020.0434. Epub 2020 Dec 30.
5
Computing the family-free DCJ similarity.计算无亲缘关系的 DCJ 相似度。
BMC Bioinformatics. 2018 May 8;19(Suppl 6):152. doi: 10.1186/s12859-018-2130-5.
6
On the family-free DCJ distance and similarity.关于无家族的DCJ距离和相似度。
Algorithms Mol Biol. 2015 Apr 1;10:13. doi: 10.1186/s13015-015-0041-9. eCollection 2015.
7
Natural family-free genomic distance.自然的无家族基因组距离。
Algorithms Mol Biol. 2021 May 10;16(1):4. doi: 10.1186/s13015-021-00183-8.
8
Algorithms for computing the double cut and join distance on both gene order and intergenic sizes.用于计算基因顺序和基因间大小的双切割与连接距离的算法。
Algorithms Mol Biol. 2017 Jun 5;12:16. doi: 10.1186/s13015-017-0107-y. eCollection 2017.
9
Approximating the DCJ distance of balanced genomes in linear time.在线性时间内近似平衡基因组的DCJ距离。
Algorithms Mol Biol. 2017 Mar 9;12:3. doi: 10.1186/s13015-017-0095-y. eCollection 2017.
10
Computation of perfect DCJ rearrangement scenarios with linear and circular chromosomes.具有线性和环状染色体的完美DCJ重排方案的计算。
J Comput Biol. 2009 Oct;16(10):1287-309. doi: 10.1089/cmb.2009.0088.

本文引用的文献

1
Computing the Rearrangement Distance of Natural Genomes.计算自然基因组的重排距离。
J Comput Biol. 2021 Apr;28(4):410-431. doi: 10.1089/cmb.2020.0434. Epub 2020 Dec 30.
2
The Ensembl gene annotation system.Ensembl基因注释系统。
Database (Oxford). 2016 Jun 23;2016. doi: 10.1093/database/baw093. Print 2016.
3
Rearrangement-based phylogeny using the Single-Cut-or-Join operation.基于单切或连操作的重排系统发育分析。
IEEE/ACM Trans Comput Biol Bioinform. 2013 Jan-Feb;10(1):122-34. doi: 10.1109/TCBB.2012.168.
4
Approximating the double-cut-and-join distance between unsigned genomes.估算无符号基因组之间的双切接距离。
BMC Bioinformatics. 2011 Oct 5;12 Suppl 9(Suppl 9):S17. doi: 10.1186/1471-2105-12-S9-S17.
5
Genomic rearrangements in inherited disease and cancer.遗传性疾病和癌症中的基因组重排。
Semin Cancer Biol. 2010 Aug;20(4):222-33. doi: 10.1016/j.semcancer.2010.05.007. Epub 2010 Jun 9.
6
MSOAR 2.0: Incorporating tandem duplications into ortholog assignment based on genome rearrangement.MSOAR 2.0:基于基因组重排的串联重复整合到直系同源物分配中。
BMC Bioinformatics. 2010 Jan 6;11:10. doi: 10.1186/1471-2105-11-10.
7
Estimating true evolutionary distances under the DCJ model.在DCJ模型下估计真实的进化距离。
Bioinformatics. 2008 Jul 1;24(13):i114-22. doi: 10.1093/bioinformatics/btn148.
8
MSOAR: a high-throughput ortholog assignment system based on genome rearrangement.MSOAR:一种基于基因组重排的高通量直系同源物分配系统。
J Comput Biol. 2007 Nov;14(9):1160-75. doi: 10.1089/cmb.2007.0048.
9
Assignment of orthologous genes via genome rearrangement.通过基因组重排进行直系同源基因的分配。
IEEE/ACM Trans Comput Biol Bioinform. 2005 Oct-Dec;2(4):302-15. doi: 10.1109/TCBB.2005.48.
10
Efficient sorting of genomic permutations by translocation, inversion and block interchange.通过易位、倒位和块交换对基因组排列进行高效排序。
Bioinformatics. 2005 Aug 15;21(16):3340-6. doi: 10.1093/bioinformatics/bti535. Epub 2005 Jun 9.