• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

MIPS细菌基因组功能注释基准数据集。

MIPS bacterial genomes functional annotation benchmark dataset.

作者信息

Tetko Igor V, Brauner Barbara, Dunger-Kaltenbach Irmtraud, Frishman Goar, Montrone Corinna, Fobo Gisela, Ruepp Andreas, Antonov Alexey V, Surmeli Dimitrij, Mewes Hans-Wernen

机构信息

Institute for Bioinformatics (MIPS), GSF National Research Center for Environment and Health, Ingolstaedter Landstrasse 1, D-85764 Neuherberg, Germany.

出版信息

Bioinformatics. 2005 May 15;21(10):2520-1. doi: 10.1093/bioinformatics/bti380. Epub 2005 Mar 15.

DOI:10.1093/bioinformatics/bti380
PMID:15769832
Abstract

MOTIVATION

Any development of new methods for automatic functional annotation of proteins according to their sequences requires high-quality data (as benchmark) as well as tedious preparatory work to generate sequence parameters required as input data for the machine learning methods. Different program settings and incompatible protocols make a comparison of the analyzed methods difficult.

RESULTS

The MIPS Bacterial Functional Annotation Benchmark dataset (MIPS-BFAB) is a new, high-quality resource comprising four bacterial genomes manually annotated according to the MIPS functional catalogue (FunCat). These resources include precalculated sequence parameters, such as sequence similarity scores, InterPro domain composition and other parameters that could be used to develop and benchmark methods for functional annotation of bacterial protein sequences. These data are provided in XML format and can be used by scientists who are not necessarily experts in genome annotation.

AVAILABILITY

BFAB is available at http://mips.gsf.de/proj/bfab

摘要

动机

任何根据蛋白质序列自动进行功能注释的新方法的开发都需要高质量的数据(作为基准)以及繁琐的准备工作,以生成作为机器学习方法输入数据所需的序列参数。不同的程序设置和不兼容的协议使得对所分析方法的比较变得困难。

结果

MIPS细菌功能注释基准数据集(MIPS-BFAB)是一个新的高质量资源,包含根据MIPS功能目录(FunCat)手动注释的四个细菌基因组。这些资源包括预先计算的序列参数,如序列相似性得分、InterPro结构域组成和其他可用于开发和基准测试细菌蛋白质序列功能注释方法的参数。这些数据以XML格式提供,可供不一定是基因组注释专家的科学家使用。

可用性

BFAB可在http://mips.gsf.de/proj/bfab获得

相似文献

1
MIPS bacterial genomes functional annotation benchmark dataset.MIPS细菌基因组功能注释基准数据集。
Bioinformatics. 2005 May 15;21(10):2520-1. doi: 10.1093/bioinformatics/bti380. Epub 2005 Mar 15.
2
Beyond the 'best' match: machine learning annotation of protein sequences by integration of different sources of information.超越“最佳”匹配:通过整合不同信息源对蛋白质序列进行机器学习注释
Bioinformatics. 2008 Mar 1;24(5):621-8. doi: 10.1093/bioinformatics/btm633. Epub 2008 Jan 3.
3
MIPS: analysis and annotation of genome information in 2007.MIPS:2007年基因组信息的分析与注释
Nucleic Acids Res. 2008 Jan;36(Database issue):D196-201. doi: 10.1093/nar/gkm980. Epub 2007 Dec 23.
4
Apollo2Go: a web service adapter for the Apollo genome viewer to enable distributed genome annotation.Apollo2Go:用于Apollo基因组浏览器的网络服务适配器,以实现分布式基因组注释。
BMC Bioinformatics. 2007 Aug 30;8:320. doi: 10.1186/1471-2105-8-320.
5
The Mouse Functional Genome Database (MfunGD): functional annotation of proteins in the light of their cellular context.小鼠功能基因组数据库(MfunGD):基于蛋白质细胞背景的功能注释
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D568-71. doi: 10.1093/nar/gkj074.
6
FunCat functional inference with belief propagation and feature integration.基于信念传播和特征整合的FunCat功能推理
Comput Biol Chem. 2008 Oct;32(5):375-7. doi: 10.1016/j.compbiolchem.2008.06.004. Epub 2008 Jul 3.
7
Benchmarking PSI-BLAST in genome annotation.在基因组注释中对PSI-BLAST进行基准测试。
J Mol Biol. 1999 Nov 12;293(5):1257-71. doi: 10.1006/jmbi.1999.3233.
8
BacTregulators: a database of transcriptional regulators in bacteria and archaea.细菌转录调控因子数据库:细菌和古菌中转录调控因子的数据库。
Bioinformatics. 2004 Nov 1;20(16):2787-91. doi: 10.1093/bioinformatics/bth330. Epub 2004 May 27.
9
KAAS: an automatic genome annotation and pathway reconstruction server.KAAS:一个自动基因组注释和通路重建服务器。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W182-5. doi: 10.1093/nar/gkm321. Epub 2007 May 25.
10
SIMAP--the similarity matrix of proteins.SIMAP——蛋白质相似性矩阵。
Bioinformatics. 2005 Sep 1;21 Suppl 2:ii42-6. doi: 10.1093/bioinformatics/bti1107.

引用本文的文献

1
Systems biology approaches integrated with artificial intelligence for optimized metabolic engineering.将系统生物学方法与人工智能相结合以实现优化的代谢工程。
Metab Eng Commun. 2020 Dec;11:e00149. doi: 10.1016/j.mec.2020.e00149. Epub 2020 Oct 9.
2
Toward an online repository of Standard Operating Procedures (SOPs) for (meta)genomic annotation.迈向用于(宏)基因组注释的标准操作程序(SOP)在线存储库。
OMICS. 2008 Jun;12(2):137-41. doi: 10.1089/omi.2008.0017.
3
A systematic approach to infer biological relevance and biases of gene network structures.
一种推断基因网络结构的生物学相关性和偏差的系统方法。
Nucleic Acids Res. 2006 Jan 10;34(1):e6. doi: 10.1093/nar/gnj002.
4
Super paramagnetic clustering of protein sequences.蛋白质序列的超顺磁聚类
BMC Bioinformatics. 2005 Apr 1;6:82. doi: 10.1186/1471-2105-6-82.