• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

NEFFy:一种用于计算有效序列数量的通用工具。

NEFFy: A Versatile Tool for Computing the Number of Effective Sequences.

作者信息

Haghani Maryam, Bhattacharya Debswapna, Murali T M

机构信息

Department of Computer Science, Virginia Tech, Blacksburg, VA 24061, United States of America.

出版信息

Bioinformatics. 2025 Jun 3. doi: 10.1093/bioinformatics/btaf222.

DOI:10.1093/bioinformatics/btaf222
PMID:40459855
Abstract

MOTIVATION

A Multiple Sequence Alignment (MSA) contains fundamental evolutionary information that is useful in the prediction of structure and function of proteins and nucleic acids. The "Number of Effective Sequences" (NEFF) quantifies the diversity of sequences of an MSA. While several tools embed NEFF calculation with various options, none are standalone tools for this purpose, and they do not offer all the available options.

RESULTS

We developed NEFFy, the first software package to integrate all these options and calculate NEFF across diverse MSA formats for proteins, RNAs, and DNAs. It surpasses existing tools in functionality without compromising computational efficiency and scalability. NEFFy also offers per-residue NEFF calculation and supports NEFF computation for MSAs of multimeric proteins, with the capability to be extended to DNAs and RNAs.

AVAILABILITY AND IMPLEMENTATION

NEFFy is released as open-source software under the GNU Public License v3.0. The source code in C ++ and a Python wrapper are available at https://github.com/Maryam-Haghani/NEFFy. To ensure users can fully leverage these capabilities, comprehensive documentation and examples are provided at https://Maryam-Haghani.github.io/NEFFy.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

多序列比对(MSA)包含了重要的进化信息,这些信息在预测蛋白质和核酸的结构与功能方面很有用。“有效序列数”(NEFF)对MSA序列的多样性进行量化。虽然有几个工具嵌入了带有各种选项的NEFF计算,但没有一个是用于此目的的独立工具,并且它们没有提供所有可用选项。

结果

我们开发了NEFFy,这是第一个集成所有这些选项并针对蛋白质、RNA和DNA的多种MSA格式计算NEFF的软件包。它在功能上超越了现有工具,同时不影响计算效率和可扩展性。NEFFy还提供每个残基的NEFF计算,并支持对多聚体蛋白质的MSA进行NEFF计算,且有扩展到DNA和RNA的能力。

可用性与实现

NEFFy作为开源软件根据GNU通用公共许可证v3.0发布。C++源代码和Python包装器可在https://github.com/Maryam-Haghani/NEFFy获取。为确保用户能够充分利用这些功能,在https://Maryam-Haghani.github.io/NEFFy提供了全面的文档和示例。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
NEFFy: A Versatile Tool for Computing the Number of Effective Sequences.NEFFy:一种用于计算有效序列数量的通用工具。
Bioinformatics. 2025 Jun 3. doi: 10.1093/bioinformatics/btaf222.
2
Sequoya: multiobjective multiple sequence alignment in Python.Sequoya:Python 中的多目标多序列比对。
Bioinformatics. 2020 Jun 1;36(12):3892-3893. doi: 10.1093/bioinformatics/btaa257.
3
NX4: a web-based visualization of large multiple sequence alignments.NX4:一个基于网络的大型多重序列比对可视化工具。
Bioinformatics. 2019 Nov 1;35(22):4800-4802. doi: 10.1093/bioinformatics/btz457.
4
Identifying functionally informative evolutionary sequence profiles.识别具有功能信息的进化序列特征。
Bioinformatics. 2018 Apr 15;34(8):1278-1286. doi: 10.1093/bioinformatics/btx779.
5
Analysing high-throughput sequencing data in Python with HTSeq 2.0.用 HTSeq 2.0 分析 Python 中的高通量测序数据。
Bioinformatics. 2022 May 13;38(10):2943-2945. doi: 10.1093/bioinformatics/btac166.
6
M2Align: parallel multiple sequence alignment with a multi-objective metaheuristic.M2Align:一种使用多目标元启发式算法的并行多序列比对方法。
Bioinformatics. 2017 Oct 1;33(19):3011-3017. doi: 10.1093/bioinformatics/btx338.
7
The CroCo cross-link converter: a user-centred tool to convert results from cross-linking mass spectrometry experiments.CroCo 交联转化器:一个以用户为中心的工具,用于转化交联质谱实验的结果。
Bioinformatics. 2020 Feb 15;36(4):1296-1297. doi: 10.1093/bioinformatics/btz732.
8
NeoFox: annotating neoantigen candidates with neoantigen features.NeoFox:利用新抗原特征对新抗原候选物进行注释。
Bioinformatics. 2021 Nov 18;37(22):4246-4247. doi: 10.1093/bioinformatics/btab344.
9
ODGI: understanding pangenome graphs.ODGI:理解泛基因组图谱。
Bioinformatics. 2022 Jun 27;38(13):3319-3326. doi: 10.1093/bioinformatics/btac308.
10
Knot_pull-python package for biopolymer smoothing and knot detection.Knot_pull-python 包,用于生物聚合物平滑和纽结检测。
Bioinformatics. 2020 Feb 1;36(3):953-955. doi: 10.1093/bioinformatics/btz644.

引用本文的文献

1
Structure Modeling Protocols for Protein Multimer and RNA in CASP16 With Enhanced MSAs, Model Ranking, and Deep Learning.利用增强型多序列比对、模型排序和深度学习的CASP16中蛋白质多聚体和RNA的结构建模协议
Proteins. 2025 Aug 1. doi: 10.1002/prot.70033.
2
CASP16 protein monomer structure prediction assessment.半胱天冬酶16(CASP16)蛋白单体结构预测评估
bioRxiv. 2025 Jun 2:2025.05.29.656942. doi: 10.1101/2025.05.29.656942.
3
Assessment of Protein Complex Predictions in CASP16: Are we making progress?对蛋白质复合物预测在蛋白质结构预测关键评估第16轮中的评估:我们有进展吗?
bioRxiv. 2025 May 30:2025.05.29.656875. doi: 10.1101/2025.05.29.656875.