• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

MEvoLib v1.0:首个面向Python的分子进化库。

MEvoLib v1.0: the first molecular evolution library for Python.

作者信息

Álvarez-Jarreta Jorge, Ruiz-Pesini Eduardo

机构信息

Depto. de Informática e Ingeniería de Sistemas (DIIS), Universidad de Zaragoza, María de Luna 1, Zaragoza, 50018, Spain.

Instituto de Investigación en Ingeniería de Aragón (I3A), Universidad de Zaragoza, Mariano Esquillor s/n, Zaragoza, 50018, Spain.

出版信息

BMC Bioinformatics. 2016 Oct 28;17(1):436. doi: 10.1186/s12859-016-1303-3.

DOI:10.1186/s12859-016-1303-3
PMID:27793083
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5084326/
Abstract

BACKGROUND

Molecular evolution studies involve many different hard computational problems solved, in most cases, with heuristic algorithms that provide a nearly optimal solution. Hence, diverse software tools exist for the different stages involved in a molecular evolution workflow.

RESULTS

We present MEvoLib, the first molecular evolution library for Python, providing a framework to work with different tools and methods involved in the common tasks of molecular evolution workflows. In contrast with already existing bioinformatics libraries, MEvoLib is focused on the stages involved in molecular evolution studies, enclosing the set of tools with a common purpose in a single high-level interface with fast access to their frequent parameterizations. The gene clustering from partial or complete sequences has been improved with a new method that integrates accessible external information (e.g. GenBank's features data). Moreover, MEvoLib adjusts the fetching process from NCBI databases to optimize the download bandwidth usage. In addition, it has been implemented using parallelization techniques to cope with even large-case scenarios.

CONCLUSIONS

MEvoLib is the first library for Python designed to facilitate molecular evolution researches both for expert and novel users. Its unique interface for each common task comprises several tools with their most used parameterizations. It has also included a method to take advantage of biological knowledge to improve the gene partition of sequence datasets. Additionally, its implementation incorporates parallelization techniques to enhance computational costs when handling very large input datasets.

摘要

背景

分子进化研究涉及许多不同的复杂计算问题,在大多数情况下,需要使用启发式算法来解决,这些算法能提供接近最优的解决方案。因此,针对分子进化工作流程中的不同阶段,存在各种各样的软件工具。

结果

我们展示了MEvoLib,这是首个用于Python的分子进化库,它提供了一个框架,用于处理分子进化工作流程常见任务中涉及的不同工具和方法。与现有的生物信息学库不同,MEvoLib专注于分子进化研究涉及的阶段,将具有共同目的的一组工具封装在一个单一的高级接口中,能够快速访问其常见的参数设置。通过一种整合可获取外部信息(如GenBank的特征数据)的新方法,改进了从部分或完整序列进行基因聚类的过程。此外,MEvoLib调整了从NCBI数据库的获取过程,以优化下载带宽的使用。此外,它采用并行化技术实现,以应对甚至是大型的情况。

结论

MEvoLib是首个为Python设计的库,旨在方便专家和新用户进行分子进化研究。其针对每个常见任务的独特接口包含了多个带有最常用参数设置的工具。它还包含一种利用生物学知识来改进序列数据集基因划分的方法。此外,其实现采用了并行化技术,以在处理非常大的输入数据集时提高计算效率。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b7c/5084326/0de2e38e159c/12859_2016_1303_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b7c/5084326/0de2e38e159c/12859_2016_1303_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b7c/5084326/0de2e38e159c/12859_2016_1303_Fig1_HTML.jpg

相似文献

1
MEvoLib v1.0: the first molecular evolution library for Python.MEvoLib v1.0:首个面向Python的分子进化库。
BMC Bioinformatics. 2016 Oct 28;17(1):436. doi: 10.1186/s12859-016-1303-3.
2
Biowep: a workflow enactment portal for bioinformatics applications.生物工作流引擎(Biowep):一个用于生物信息学应用的工作流制定门户。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S19. doi: 10.1186/1471-2105-8-S1-S19.
3
Workflows in bioinformatics: meta-analysis and prototype implementation of a workflow generator.生物信息学中的工作流程:工作流程生成器的元分析与原型实现
BMC Bioinformatics. 2005 Apr 7;6:87. doi: 10.1186/1471-2105-6-87.
4
SS-Wrapper: a package of wrapper applications for similarity searches on Linux clusters.SS-Wrapper:用于在Linux集群上进行相似性搜索的一组包装应用程序。
BMC Bioinformatics. 2004 Oct 28;5:171. doi: 10.1186/1471-2105-5-171.
5
rstoolbox - a Python library for large-scale analysis of computational protein design data and structural bioinformatics.rstoolbox - 一个用于大规模分析计算蛋白质设计数据和结构生物信息学的 Python 库。
BMC Bioinformatics. 2019 May 15;20(1):240. doi: 10.1186/s12859-019-2796-3.
6
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
7
Bio++: efficient extensible libraries and tools for computational molecular evolution.Bio++:用于计算分子进化的高效可扩展库和工具。
Mol Biol Evol. 2013 Aug;30(8):1745-50. doi: 10.1093/molbev/mst097. Epub 2013 May 21.
8
Biotite: a unifying open source computational biology framework in Python.黑云母:一个用 Python 实现的统一的开源计算生物学框架。
BMC Bioinformatics. 2018 Oct 1;19(1):346. doi: 10.1186/s12859-018-2367-z.
9
Parallel workflow manager for non-parallel bioinformatic applications to solve large-scale biological problems on a supercomputer.用于非并行生物信息学应用程序的并行工作流管理器,以在超级计算机上解决大规模生物学问题。
J Bioinform Comput Biol. 2016 Apr;14(2):1641008. doi: 10.1142/S0219720016410080.
10
Utility library for structural bioinformatics.用于结构生物信息学的实用程序库。
Bioinformatics. 2008 Feb 15;24(4):584-5. doi: 10.1093/bioinformatics/btm627. Epub 2008 Jan 28.

本文引用的文献

1
Next-generation sequencing: methodology and application.下一代测序:方法与应用。
J Invest Dermatol. 2013 Aug;133(8):e11. doi: 10.1038/jid.2013.248.
2
DACTAL: divide-and-conquer trees (almost) without alignments.DACTAL:无需对齐的分而治之树(几乎)。
Bioinformatics. 2012 Jun 15;28(12):i274-82. doi: 10.1093/bioinformatics/bts218.
3
Molecular phylogenetics: principles and practice.分子系统发育学:原理与实践。
Nat Rev Genet. 2012 Mar 28;13(5):303-14. doi: 10.1038/nrg3186.
4
Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega.使用 Clustal Omega 快速、可扩展地生成高质量蛋白质多重序列比对。
Mol Syst Biol. 2011 Oct 11;7:539. doi: 10.1038/msb.2011.75.
5
SuperFine: fast and accurate supertree estimation.SuperFine:快速准确的超级树估计。
Syst Biol. 2012 Mar;61(2):214-27. doi: 10.1093/sysbio/syr092. Epub 2011 Sep 20.
6
GenBank.GenBank。
Nucleic Acids Res. 2010 Jan;38(Database issue):D46-51. doi: 10.1093/nar/gkp1024. Epub 2009 Nov 12.
7
FastTree: computing large minimum evolution trees with profiles instead of a distance matrix.FastTree:使用序列概况而非距离矩阵计算大型最小进化树。
Mol Biol Evol. 2009 Jul;26(7):1641-50. doi: 10.1093/molbev/msp077. Epub 2009 Apr 17.
8
Biopython: freely available Python tools for computational molecular biology and bioinformatics.Biopython:用于计算分子生物学和生物信息学的免费可用Python工具。
Bioinformatics. 2009 Jun 1;25(11):1422-3. doi: 10.1093/bioinformatics/btp163. Epub 2009 Mar 20.
9
Phylogeny-aware gap placement prevents errors in sequence alignment and evolutionary analysis.系统发育感知缺口放置可防止序列比对和进化分析中的错误。
Science. 2008 Jun 20;320(5883):1632-5. doi: 10.1126/science.1158395.
10
RAxML-VI-HPC: maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models.RAxML-VI-HPC:基于最大似然法的系统发育分析,适用于数千个分类单元及混合模型。
Bioinformatics. 2006 Nov 1;22(21):2688-90. doi: 10.1093/bioinformatics/btl446. Epub 2006 Aug 23.