• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SNAD:基于序列名称注释的设计器。

SNAD: Sequence Name Annotation-based Designer.

机构信息

Molecular Virology Laboratory, Department of Medical Microbiology, Center of Infectious Diseases, Leiden University Medical Center, Leiden, Netherlands.

出版信息

BMC Bioinformatics. 2009 Aug 14;10:251. doi: 10.1186/1471-2105-10-251.

DOI:10.1186/1471-2105-10-251
PMID:19682364
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2739203/
Abstract

BACKGROUND

A growing diversity of biological data is tagged with unique identifiers (UIDs) associated with polynucleotides and proteins to ensure efficient computer-mediated data storage, maintenance, and processing. These identifiers, which are not informative for most people, are often substituted by biologically meaningful names in various presentations to facilitate utilization and dissemination of sequence-based knowledge. This substitution is commonly done manually that may be a tedious exercise prone to mistakes and omissions.

RESULTS

Here we introduce SNAD (Sequence Name Annotation-based Designer) that mediates automatic conversion of sequence UIDs (associated with multiple alignment or phylogenetic tree, or supplied as plain text list) into biologically meaningful names and acronyms. This conversion is directed by precompiled or user-defined templates that exploit wealth of annotation available in cognate entries of external databases. Using examples, we demonstrate how this tool can be used to generate names for practical purposes, particularly in virology.

CONCLUSION

A tool for controllable annotation-based conversion of sequence UIDs into biologically meaningful names and acronyms has been developed and placed into service, fostering links between quality of sequence annotation, and efficiency of communication and knowledge dissemination among researchers.

摘要

背景

越来越多的生物数据都被打上了与多核苷酸和蛋白质相关的唯一标识符 (UID),以确保高效的计算机中介数据存储、维护和处理。这些标识符对大多数人来说没有信息意义,通常在各种表示中被生物上有意义的名称所取代,以促进基于序列的知识的利用和传播。这种替换通常是手动完成的,可能是一项繁琐的工作,容易出错和遗漏。

结果

在这里,我们介绍了 SNAD(基于序列名称注释的设计器),它可以将序列 UID(与多序列比对或系统发育树相关联,或作为纯文本列表提供)自动转换为具有生物意义的名称和缩写。这种转换是由预编译或用户定义的模板指导的,这些模板利用了外部数据库中同源条目提供的丰富注释。通过示例,我们展示了如何将此工具用于实际目的,特别是在病毒学中生成名称。

结论

已经开发并提供了一种用于基于可控注释的序列 UID 到具有生物意义的名称和缩写的转换的工具,促进了序列注释的质量与研究人员之间的通信和知识传播效率之间的联系。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c8f5/2739203/ab3ec8cff14c/1471-2105-10-251-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c8f5/2739203/0e684a50fe53/1471-2105-10-251-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c8f5/2739203/ab3ec8cff14c/1471-2105-10-251-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c8f5/2739203/0e684a50fe53/1471-2105-10-251-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c8f5/2739203/ab3ec8cff14c/1471-2105-10-251-2.jpg

相似文献

1
SNAD: Sequence Name Annotation-based Designer.SNAD:基于序列名称注释的设计器。
BMC Bioinformatics. 2009 Aug 14;10:251. doi: 10.1186/1471-2105-10-251.
2
MILANO--custom annotation of microarray results using automatic literature searches.米兰——使用自动文献检索对微阵列结果进行定制注释。
BMC Bioinformatics. 2005 Jan 20;6:12. doi: 10.1186/1471-2105-6-12.
3
AutoFACT: an automatic functional annotation and classification tool.自动事实:一种自动功能注释和分类工具。
BMC Bioinformatics. 2005 Jun 16;6:151. doi: 10.1186/1471-2105-6-151.
4
METIS: multiple extraction techniques for informative sentences.METIS:用于提取信息性句子的多种提取技术。
Bioinformatics. 2005 Nov 15;21(22):4196-7. doi: 10.1093/bioinformatics/bti675. Epub 2005 Sep 13.
5
Key2Ann: a tool to process sequence sets by replacing database identifiers with a human-readable annotation.Key2Ann:一种通过用人类可读注释替换数据库标识符来处理序列集的工具。
J Integr Bioinform. 2011 Mar 4;8(1):539. doi: 10.2390/biecoll-jib-2011-153.
6
A Taxonomic Search Engine: federating taxonomic databases using web services.一个分类搜索引擎:使用网络服务联合分类数据库。
BMC Bioinformatics. 2005 Mar 9;6:48. doi: 10.1186/1471-2105-6-48.
7
Web servicing the biological office.网络服务生物办公室。
Bioinformatics. 2005 Sep 1;21 Suppl 2:ii268-9. doi: 10.1093/bioinformatics/bti1144.
8
PhyloGena--a user-friendly system for automated phylogenetic annotation of unknown sequences.PhyloGena——一个用于对未知序列进行自动系统发育注释的用户友好型系统。
Bioinformatics. 2007 Apr 1;23(7):793-801. doi: 10.1093/bioinformatics/btm016. Epub 2007 Mar 1.
9
MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization.MAFFT 在线服务:多序列比对、交互式序列选择和可视化。
Brief Bioinform. 2019 Jul 19;20(4):1160-1166. doi: 10.1093/bib/bbx108.
10
PROMPT: a protein mapping and comparison tool.提示:一种蛋白质图谱绘制与比较工具。
BMC Bioinformatics. 2006 Jul 4;7:331. doi: 10.1186/1471-2105-7-331.

引用本文的文献

1
Phylodynamic and phylogeographic analysis of the complete genome of the West Nile virus lineage 2 (WNV-2) in the Mediterranean basin.对地中海盆地西尼罗河病毒谱系 2(WNV-2)全基因组的系统发育和系统地理学分析。
BMC Ecol Evol. 2021 Sep 27;21(1):183. doi: 10.1186/s12862-021-01902-w.
2
Coding-Gene Coevolution Analysis of Rotavirus Proteins: A Bioinformatics and Statistical Approach.轮状病毒蛋白编码基因共进化分析:一种生物信息学和统计学方法。
Genes (Basel). 2019 Dec 24;11(1):28. doi: 10.3390/genes11010028.
3
Discovery of an essential nucleotidylating activity associated with a newly delineated conserved domain in the RNA polymerase-containing protein of all nidoviruses.

本文引用的文献

1
A nomenclature for avian coronavirus isolates and the question of species status.禽类冠状病毒分离株的命名法及有关种地位问题。
Avian Pathol. 2001 Apr;30(2):109-15. doi: 10.1080/03079450120044506.
2
Transmission networks and population turnover of echovirus 30.肠道病毒30型的传播网络与人群更替
J Virol. 2009 Mar;83(5):2109-18. doi: 10.1128/JVI.02109-08. Epub 2008 Dec 17.
3
A highly prevalent and genetically diversified Picornaviridae genus in South Asian children.南亚儿童中一种高度流行且基因多样化的小RNA病毒科属。
在所有尼多病毒含RNA聚合酶蛋白中新鉴定的保守结构域中发现一种必需的核苷酸化活性。
Nucleic Acids Res. 2015 Sep 30;43(17):8416-34. doi: 10.1093/nar/gkv838. Epub 2015 Aug 24.
4
Arterivirus nsp12 versus the coronavirus nsp16 2'-O-methyltransferase: comparison of the C-terminal cleavage products of two nidovirus pp1ab polyproteins.动脉炎病毒非结构蛋白12与冠状病毒非结构蛋白16 2'-O-甲基转移酶:两种巢病毒多聚蛋白pp1ab C末端裂解产物的比较
J Gen Virol. 2015 Sep;96(9):2643-2655. doi: 10.1099/vir.0.000209. Epub 2015 Jun 3.
5
Practical application of bioinformatics by the multidisciplinary VIZIER consortium.多学科VIZIER联盟对生物信息学的实际应用。
Antiviral Res. 2010 Aug;87(2):95-110. doi: 10.1016/j.antiviral.2010.02.005. Epub 2010 Feb 11.
Proc Natl Acad Sci U S A. 2008 Dec 23;105(51):20482-7. doi: 10.1073/pnas.0807979105. Epub 2008 Nov 25.
4
The Gene Ontology Annotation (GOA) Project--Application of GO in SWISS-PROT, TrEMBL and InterPro.基因本体注释(GOA)项目——基因本体在SWISS-PROT、TrEMBL和InterPro中的应用。
Comp Funct Genomics. 2003;4(1):71-4. doi: 10.1002/cfg.235.
5
Phylogeny of the genus Arenavirus.沙粒病毒属的系统发育
Curr Opin Microbiol. 2008 Aug;11(4):362-8. doi: 10.1016/j.mib.2008.06.001. Epub 2008 Jul 17.
6
Virus attenuation by genome-scale changes in codon pair bias.通过密码子对偏好性的全基因组规模变化实现病毒减毒
Science. 2008 Jun 27;320(5884):1784-7. doi: 10.1126/science.1155761.
7
Geminivirus strain demarcation and nomenclature.双生病毒株系划分与命名
Arch Virol. 2008;153(4):783-821. doi: 10.1007/s00705-008-0037-6. Epub 2008 Feb 7.
8
Phyutility: a phyloinformatics tool for trees, alignments and molecular data.Phyutility:一款用于处理系统发育树、序列比对和分子数据的系统发育信息学工具。
Bioinformatics. 2008 Mar 1;24(5):715-6. doi: 10.1093/bioinformatics/btm619. Epub 2008 Jan 28.
9
GenBank.基因银行
Nucleic Acids Res. 2008 Jan;36(Database issue):D25-30. doi: 10.1093/nar/gkm929. Epub 2007 Dec 11.
10
DAVID Knowledgebase: a gene-centered database integrating heterogeneous gene annotation resources to facilitate high-throughput gene functional analysis.大卫知识库:一个以基因为中心的数据库,整合了异构基因注释资源,以促进高通量基因功能分析。
BMC Bioinformatics. 2007 Nov 2;8:426. doi: 10.1186/1471-2105-8-426.