• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SIFTER-T:一种用于概率性蛋白质结构域注释的SIFTER系统发育基因组学方法的可扩展且优化的框架。

SIFTER-T: a scalable and optimized framework for the SIFTER phylogenomic method of probabilistic protein domain annotation.

作者信息

Almeida-e-Silva Danillo C, Vêncio Ricardo Z N

机构信息

Department of Computing and Mathematics FFCLRP-USP, University of Sao Paulo, Ribeirão Preto, Brazil.

出版信息

Biotechniques. 2015 Mar 1;58(3):140-2. doi: 10.2144/000114266. eCollection 2015 Mar.

DOI:10.2144/000114266
PMID:25757547
Abstract

Statistical Inference of Function Through Evolutionary Relationships (SIFTER) is a powerful computational platform for probabilistic protein domain annotation. Nevertheless, SIFTER is not widely used, likely due to usability and scalability issues. Here we present SIFTER-T (SIFTER Throughput-optimized), a substantial improvement over SIFTER's original proof-of-principle implementation. SIFTER-T is optimized for better performance, allowing it to be used at the genome-wide scale. Compared to SIFTER 2.0, SIFTER-T achieved an 87-fold performance improvement using published test data sets for the known annotations recovering module and a 72.3% speed increase for the gene tree generation module in quad-core machines, as well as a major decrease in memory usage during the realignment phase. Memory optimization allowed an expanded set of proteins to be handled by SIFTER's probabilistic method. The improvement in performance and automation that we achieved allowed us to build a web server to bring the power of Bayesian phylogenomic inference to the genomics community. SIFTER-T and its online interface are freely available under GNU license at http://labpib.fmrp.usp.br/methods/SIFTER-t/ and https://github.com/dcasbioinfo/SIFTER-t.

摘要

通过进化关系进行功能的统计推断(SIFTER)是用于概率性蛋白质结构域注释的强大计算平台。然而,SIFTER并未得到广泛应用,可能是由于可用性和可扩展性问题。在此,我们展示了SIFTER-T(吞吐量优化的SIFTER),它是对SIFTER原始原理验证实现的重大改进。SIFTER-T针对更好的性能进行了优化,使其能够在全基因组范围内使用。与SIFTER 2.0相比,使用已发布的已知注释恢复模块测试数据集,SIFTER-T的性能提升了87倍,在四核机器中基因树生成模块的速度提高了72.3%,并且在重新比对阶段内存使用大幅减少。内存优化使得SIFTER的概率方法能够处理更多的蛋白质。我们在性能和自动化方面所取得的改进使我们能够构建一个网络服务器,将贝叶斯系统发育基因组学推断的能力带给基因组学界。SIFTER-T及其在线界面可根据GNU许可在http://labpib.fmrp.usp.br/methods/SIFTER-t/和https://github.com/dcasbioinfo/SIFTER-t免费获取。

相似文献

1
SIFTER-T: a scalable and optimized framework for the SIFTER phylogenomic method of probabilistic protein domain annotation.SIFTER-T:一种用于概率性蛋白质结构域注释的SIFTER系统发育基因组学方法的可扩展且优化的框架。
Biotechniques. 2015 Mar 1;58(3):140-2. doi: 10.2144/000114266. eCollection 2015 Mar.
2
SIFTER search: a web server for accurate phylogeny-based protein function prediction.SIFTER搜索:一个用于基于系统发育的蛋白质功能准确预测的网络服务器。
Nucleic Acids Res. 2015 Jul 1;43(W1):W141-7. doi: 10.1093/nar/gkv461. Epub 2015 May 15.
3
Protein molecular function prediction by Bayesian phylogenomics.基于贝叶斯系统发育基因组学的蛋白质分子功能预测
PLoS Comput Biol. 2005 Oct;1(5):e45. doi: 10.1371/journal.pcbi.0010045. Epub 2005 Oct 7.
4
Genome-scale phylogenetic function annotation of large and diverse protein families.大规模和多样化蛋白质家族的基因组尺度系统发育功能注释。
Genome Res. 2011 Nov;21(11):1969-80. doi: 10.1101/gr.104687.109. Epub 2011 Jul 22.
5
Assessing annotation transfer for genomics: quantifying the relations between protein sequence, structure and function through traditional and probabilistic scores.评估基因组学中的注释转移:通过传统分数和概率分数量化蛋白质序列、结构与功能之间的关系。
J Mol Biol. 2000 Mar 17;297(1):233-49. doi: 10.1006/jmbi.2000.3550.
6
Protein Sequence Annotation Tool (PSAT): a centralized web-based meta-server for high-throughput sequence annotations.蛋白质序列注释工具(PSAT):一个基于网络的集中式元服务器,用于高通量序列注释。
BMC Bioinformatics. 2016 Jan 20;17:43. doi: 10.1186/s12859-016-0887-y.
7
Automated Improvement of Domain ANnotations using context analysis of domain arrangements (AIDAN).使用领域排列的上下文分析自动改进领域注释(AIDAN)。
Bioinformatics. 2007 Jul 15;23(14):1834-6. doi: 10.1093/bioinformatics/btm240. Epub 2007 May 5.
8
Jannovar: a java library for exome annotation.Jannovar:一个用于外显子注释的Java库。
Hum Mutat. 2014 May;35(5):548-55. doi: 10.1002/humu.22531. Epub 2014 Apr 9.
9
Mercator: a fast and simple web server for genome scale functional annotation of plant sequence data.墨卡托:一种用于植物序列数据基因组规模功能注释的快速简易网络服务器。
Plant Cell Environ. 2014 May;37(5):1250-8. doi: 10.1111/pce.12231. Epub 2013 Dec 17.
10
FuncPatch: a web server for the fast Bayesian inference of conserved functional patches in protein 3D structures.FuncPatch:一个用于快速贝叶斯推断蛋白质 3D 结构中保守功能斑块的网络服务器。
Bioinformatics. 2015 Feb 15;31(4):523-31. doi: 10.1093/bioinformatics/btu673. Epub 2014 Oct 15.