• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

从GenBank到TNT:助力从GenBank创建矩阵并诊断TNT中的结果。

GB-to-TNT: facilitating creation of matrices from GenBank and diagnosis of results in TNT.

作者信息

Goloboff Pablo A, Catalano Santiago A

机构信息

Consejo Nacional de Investigaciones Científicas y Técnicas, Miguel Lillo 205, 4000 S.M. de Tucumán, Argentina.

Instituto Miguel Lillo, Facultad de Ciencias Naturales, Miguel Lillo 205, 4000 S.M. de Tucumán, Argentina.

出版信息

Cladistics. 2012 Oct;28(5):503-513. doi: 10.1111/j.1096-0031.2012.00400.x. Epub 2012 May 4.

DOI:10.1111/j.1096-0031.2012.00400.x
PMID:34844379
Abstract

This paper presents a pipeline, implemented in an open-source program called GB→TNT (GenBank-to-TNT), for creating large molecular matrices, starting from GenBank files and finishing with TNT matrices which incorporate taxonomic information in the terminal names. GB→TNT is designed to retrieve a defined genomic region from a bulk of sequences included in a GenBank file. The user defines the genomic region to be retrieved and several filters (genome, length of the sequence, taxonomic group, etc.); each genomic region represents a different data block in the final TNT matrix. GB→TNT first generates Fasta files from the input GenBank files, then creates an alignment for each of those (by calling an alignment program), and finally merges all the aligned files into a single TNT matrix. The new version of TNT can make use of the taxonomic information contained in the terminal names, allowing easy diagnosis of results, evaluation of fit between the trees and the taxonomy, and automatic labelling or colouring of tree branches with the taxonomic groups they represent. © The Willi Hennig Society 2012.

摘要

本文介绍了一种通过名为GB→TNT(从基因库到TNT)的开源程序实现的流程,用于创建大型分子矩阵,该流程从GenBank文件开始,以在终端名称中纳入分类信息的TNT矩阵结束。GB→TNT旨在从GenBank文件中包含的大量序列中检索定义的基因组区域。用户定义要检索的基因组区域和几个过滤器(基因组、序列长度、分类组等);每个基因组区域在最终的TNT矩阵中代表一个不同的数据块。GB→TNT首先从输入的GenBank文件生成Fasta文件,然后为每个文件创建一个比对(通过调用一个比对程序),最后将所有比对文件合并成一个单一的TNT矩阵。TNT的新版本可以利用终端名称中包含的分类信息,便于结果诊断、评估树与分类法之间的拟合度,以及用它们所代表的分类组自动标记或给树枝上色。© 威利·亨尼希协会2012年。

相似文献

1
GB-to-TNT: facilitating creation of matrices from GenBank and diagnosis of results in TNT.从GenBank到TNT:助力从GenBank创建矩阵并诊断TNT中的结果。
Cladistics. 2012 Oct;28(5):503-513. doi: 10.1111/j.1096-0031.2012.00400.x. Epub 2012 May 4.
2
SequenceMatrix: concatenation software for the fast assembly of multi-gene datasets with character set and codon information.SequenceMatrix:用于快速组装具有字符集和密码子信息的多基因数据集的拼接软件。
Cladistics. 2011 Apr;27(2):171-180. doi: 10.1111/j.1096-0031.2010.00329.x.
3
ORFer--retrieval of protein sequences and open reading frames from GenBank and storage into relational databases or text files.ORFer——从GenBank中检索蛋白质序列和开放阅读框,并存储到关系数据库或文本文件中。
BMC Bioinformatics. 2002 Dec 19;3:40. doi: 10.1186/1471-2105-3-40.
4
Taxonomic colouring of phylogenetic trees of protein sequences.蛋白质序列系统发育树的分类着色。
BMC Bioinformatics. 2006 Feb 17;7:79. doi: 10.1186/1471-2105-7-79.
5
GB2sequin - A file converter preparing custom GenBank files for database submission.GB2sequin - 一种文件转换器,用于准备定制的 GenBank 文件以进行数据库提交。
Genomics. 2019 Jul;111(4):759-761. doi: 10.1016/j.ygeno.2018.05.003. Epub 2018 May 26.
6
Phylogenetic supermatrix analysis of GenBank sequences from 2228 papilionoid legumes.对2228种蝶形花科豆科植物的GenBank序列进行系统发育超矩阵分析。
Syst Biol. 2006 Oct;55(5):818-36. doi: 10.1080/10635150600999150.
7
FASconCAT: Convenient handling of data matrices.FASconCAT:方便的数据矩阵处理。
Mol Phylogenet Evol. 2010 Sep;56(3):1115-8. doi: 10.1016/j.ympev.2010.04.024. Epub 2010 Apr 21.
8
REFGEN and TREENAMER: automated sequence data handling for phylogenetic analysis in the genomic era.REFGEN 和 TREENAMER:基因组时代下用于系统发育分析的自动化序列数据处理。
Evol Bioinform Online. 2009 May 6;5:1-4. doi: 10.4137/ebo.s2331.
9
Taxonize-gb: A tool for filtering GenBank non-redundant databases based on taxonomy.Taxonize-gb:一种基于分类学对GenBank非冗余数据库进行筛选的工具。
bioRxiv. 2024 Mar 27:2024.03.22.586347. doi: 10.1101/2024.03.22.586347.
10
: an R package to extract subsequences from GenBank annotations.一个用于从GenBank注释中提取子序列的R包。
PeerJ. 2018 Jul 3;6:e5179. doi: 10.7717/peerj.5179. eCollection 2018.

引用本文的文献

1
A review of the taxonomy of spiny-backed orb-weaving spiders of the subfamily Gasteracanthinae (Araneae, Araneidae) in Thailand.泰国棘腹蛛亚科(蜘蛛目,园蛛科)多刺圆蛛的分类学综述
Zookeys. 2021 Apr 16;1032:17-62. doi: 10.3897/zookeys.1032.62001. eCollection 2021.
2
Macro-Climatic Distribution Limits Show Both Niche Expansion and Niche Specialization among C4 Panicoids.宏观气候分布界限显示了C4黍族植物中生态位扩展和生态位特化的现象。
PLoS One. 2016 Mar 7;11(3):e0151075. doi: 10.1371/journal.pone.0151075. eCollection 2016.