• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PhyloPat:真核基因的系统发育模式分析

PhyloPat: phylogenetic pattern analysis of eukaryotic genes.

作者信息

Hulsen Tim, de Vlieg Jacob, Groenen Peter M A

机构信息

Centre for Molecular and Biomolecular Informatics (CMBI), Nijmegen Centre for Molecular Life Sciences (NCMLS), Radboud University Nijmegen, Nijmegen, The Netherlands.

出版信息

BMC Bioinformatics. 2006 Sep 1;7:398. doi: 10.1186/1471-2105-7-398.

DOI:10.1186/1471-2105-7-398
PMID:16948844
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1570148/
Abstract

BACKGROUND

Phylogenetic patterns show the presence or absence of certain genes or proteins in a set of species. They can also be used to determine sets of genes or proteins that occur only in certain evolutionary branches. Phylogenetic patterns analysis has routinely been applied to protein databases such as COG and OrthoMCL, but not upon gene databases. Here we present a tool named PhyloPat which allows the complete Ensembl gene database to be queried using phylogenetic patterns.

DESCRIPTION

PhyloPat is an easy-to-use webserver, which can be used to query the orthologies of all complete genomes within the EnsMart database using phylogenetic patterns. This enables the determination of sets of genes that occur only in certain evolutionary branches or even single species. We found in total 446,825 genes and 3,164,088 orthologous relationships within the EnsMart v40 database. We used a single linkage clustering algorithm to create 147,922 phylogenetic lineages, using every one of the orthologies provided by Ensembl. PhyloPat provides the possibility of querying with either binary phylogenetic patterns (created by checkboxes) or regular expressions. Specific branches of a phylogenetic tree of the 21 included species can be selected to create a branch-specific phylogenetic pattern. Users can also input a list of Ensembl or EMBL IDs to check which phylogenetic lineage any gene belongs to. The output can be saved in HTML, Excel or plain text format for further analysis. A link to the FatiGO web interface has been incorporated in the HTML output, creating easy access to functional information. Finally, lists of omnipresent, polypresent and oligopresent genes have been included.

CONCLUSION

PhyloPat is the first tool to combine complete genome information with phylogenetic pattern querying. Since we used the orthologies generated by the accurate pipeline of Ensembl, the obtained phylogenetic lineages are reliable. The completeness and reliability of these phylogenetic lineages will further increase with the addition of newly found orthologous relationships within each new Ensembl release.

摘要

背景

系统发育模式显示了一组物种中某些基因或蛋白质的存在与否。它们还可用于确定仅出现在某些进化分支中的基因或蛋白质组。系统发育模式分析通常应用于诸如COG和OrthoMCL等蛋白质数据库,但尚未应用于基因数据库。在此,我们展示了一种名为PhyloPat的工具,它允许使用系统发育模式查询完整的Ensembl基因数据库。

描述

PhyloPat是一个易于使用的网络服务器,可用于使用系统发育模式查询EnsMart数据库中所有完整基因组的直系同源关系。这使得能够确定仅出现在某些进化分支甚至单个物种中的基因集。我们在EnsMart v40数据库中总共发现了446,825个基因和3,164,088个直系同源关系。我们使用单连锁聚类算法,利用Ensembl提供的每一个直系同源关系创建了147,922个系统发育谱系。PhyloPat提供了使用二元系统发育模式(由复选框创建)或正则表达式进行查询的可能性。可以选择21个纳入物种的系统发育树的特定分支来创建特定分支的系统发育模式。用户还可以输入Ensembl或EMBL ID列表,以检查任何基因属于哪个系统发育谱系。输出可以保存为HTML、Excel或纯文本格式以供进一步分析。HTML输出中包含了指向FatiGO网络界面的链接,便于获取功能信息。最后,还包括了普遍存在、多物种存在和寡物种存在基因的列表。

结论

PhyloPat是第一个将完整基因组信息与系统发育模式查询相结合的工具。由于我们使用了Ensembl精确流程生成的直系同源关系,因此获得的系统发育谱系是可靠的。随着每个新的Ensembl版本中新增直系同源关系的加入,这些系统发育谱系的完整性和可靠性将进一步提高。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/ed0e8fdb5fad/1471-2105-7-398-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/4591dfb8a6eb/1471-2105-7-398-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/33bc81769c47/1471-2105-7-398-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/1396dcadb2e8/1471-2105-7-398-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/ed0e8fdb5fad/1471-2105-7-398-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/4591dfb8a6eb/1471-2105-7-398-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/33bc81769c47/1471-2105-7-398-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/1396dcadb2e8/1471-2105-7-398-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b0df/1570148/ed0e8fdb5fad/1471-2105-7-398-4.jpg

相似文献

1
PhyloPat: phylogenetic pattern analysis of eukaryotic genes.PhyloPat:真核基因的系统发育模式分析
BMC Bioinformatics. 2006 Sep 1;7:398. doi: 10.1186/1471-2105-7-398.
2
PhyloPat: an updated version of the phylogenetic pattern database contains gene neighborhood.PhyloPat:包含基因邻域的系统发育模式数据库的更新版本。
Nucleic Acids Res. 2009 Jan;37(Database issue):D731-7. doi: 10.1093/nar/gkn645. Epub 2008 Oct 2.
3
OrthologID: automation of genome-scale ortholog identification within a parsimony framework.直系同源物ID:简约框架内全基因组规模直系同源物鉴定的自动化
Bioinformatics. 2006 Mar 15;22(6):699-707. doi: 10.1093/bioinformatics/btk040. Epub 2006 Jan 12.
4
GeneTools--application for functional annotation and statistical hypothesis testing.基因工具——用于功能注释和统计假设检验的应用程序。
BMC Bioinformatics. 2006 Oct 24;7:470. doi: 10.1186/1471-2105-7-470.
5
PhyloGena--a user-friendly system for automated phylogenetic annotation of unknown sequences.PhyloGena——一个用于对未知序列进行自动系统发育注释的用户友好型系统。
Bioinformatics. 2007 Apr 1;23(7):793-801. doi: 10.1093/bioinformatics/btm016. Epub 2007 Mar 1.
6
MANTIS: a phylogenetic framework for multi-species genome comparisons.螳螂:多物种基因组比较的系统发育框架。
Bioinformatics. 2008 Jan 15;24(2):151-7. doi: 10.1093/bioinformatics/btm567. Epub 2007 Nov 19.
7
Nested Containment List (NCList): a new algorithm for accelerating interval query of genome alignment and interval databases.嵌套包含列表(NCList):一种加速基因组比对和区间数据库区间查询的新算法。
Bioinformatics. 2007 Jun 1;23(11):1386-93. doi: 10.1093/bioinformatics/btl647. Epub 2007 Jan 18.
8
GenomeBlast: a web tool for small genome comparison.基因组比对工具(GenomeBlast):一种用于小型基因组比较的网络工具。
BMC Bioinformatics. 2006 Dec 12;7 Suppl 4(Suppl 4):S18. doi: 10.1186/1471-2105-7-S4-S18.
9
ESTuber db: an online database for Tuber borchii EST sequences.ESTuber数据库:一个用于意大利白块菌EST序列的在线数据库。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S13. doi: 10.1186/1471-2105-8-S1-S13.
10
CEGMA: a pipeline to accurately annotate core genes in eukaryotic genomes.CEGMA:一种用于准确注释真核生物基因组中核心基因的流程。
Bioinformatics. 2007 May 1;23(9):1061-7. doi: 10.1093/bioinformatics/btm071. Epub 2007 Mar 1.

引用本文的文献

1
Relaxed purifying selection and possibly high rate of adaptation in primate lineage-specific genes.灵长类特有的基因中存在放松的净化选择和可能较高的适应速率。
Genome Biol Evol. 2010 Jul 12;2:393-409. doi: 10.1093/gbe/evq019.
2
Similarly strong purifying selection acts on human disease genes of all evolutionary ages.同样强烈的净化选择作用于所有进化年龄的人类疾病基因。
Genome Biol Evol. 2009 May 27;1:131-44. doi: 10.1093/gbe/evp013.
3
Genomics and bioinformatics resources for crop improvement.作物改良的基因组学和生物信息学资源。

本文引用的文献

1
Benchmarking ortholog identification methods using functional genomics data.使用功能基因组学数据对直系同源物鉴定方法进行基准测试。
Genome Biol. 2006;7(4):R31. doi: 10.1186/gb-2006-7-4-r31. Epub 2006 Apr 13.
2
A phylogenomic gene cluster resource: the Phylogenetically Inferred Groups (PhIGs) database.一种系统发育基因组基因簇资源:系统发育推断组(PhIGs)数据库。
BMC Bioinformatics. 2006 Apr 11;7:201. doi: 10.1186/1471-2105-7-201.
3
TreeFam: a curated database of phylogenetic trees of animal gene families.TreeFam:一个经过精心策划的动物基因家族系统发育树数据库。
Plant Cell Physiol. 2010 Apr;51(4):497-523. doi: 10.1093/pcp/pcq027. Epub 2010 Mar 5.
4
Dynamism in gene expression across multiple studies.在多个研究中基因表达的动态变化。
Physiol Genomics. 2010 Feb 4;40(3):128-40. doi: 10.1152/physiolgenomics.90403.2008. Epub 2009 Nov 17.
5
Testicular cell adhesion molecule 1 (TCAM1) is not essential for fertility.睾丸细胞黏附分子 1(TCAM1)对于生育并非必需。
Mol Cell Endocrinol. 2010 Feb 5;315(1-2):246-53. doi: 10.1016/j.mce.2009.09.010. Epub 2009 Sep 17.
6
BioVenn - a web application for the comparison and visualization of biological lists using area-proportional Venn diagrams.BioVenn - 一个使用面积比例维恩图对生物列表进行比较和可视化的网络应用程序。
BMC Genomics. 2008 Oct 16;9:488. doi: 10.1186/1471-2164-9-488.
7
PhyloPat: an updated version of the phylogenetic pattern database contains gene neighborhood.PhyloPat:包含基因邻域的系统发育模式数据库的更新版本。
Nucleic Acids Res. 2009 Jan;37(Database issue):D731-7. doi: 10.1093/nar/gkn645. Epub 2008 Oct 2.
8
Preservation of genes involved in sterol metabolism in cholesterol auxotrophs: facts and hypotheses.胆固醇营养缺陷型中参与甾醇代谢的基因的保存:事实与假说
PLoS One. 2008 Aug 6;3(8):e2883. doi: 10.1371/journal.pone.0002883.
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D572-80. doi: 10.1093/nar/gkj118.
4
Ensembl 2006.Ensembl 2006。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D556-61. doi: 10.1093/nar/gkj133.
5
OrthoMCL-DB: querying a comprehensive multi-species collection of ortholog groups.OrthoMCL-DB:查询直系同源基因组的全面多物种集合。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D363-8. doi: 10.1093/nar/gkj123.
6
The HUGO Gene Nomenclature Database, 2006 updates.《人类基因组组织基因命名数据库》2006年更新版。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D319-21. doi: 10.1093/nar/gkj147.
7
No more than 14: the end of the amphioxus Hox cluster.不超过14个:文昌鱼Hox基因簇的末端。
Int J Biol Sci. 2005;1(1):19-23. doi: 10.7150/ijbs.1.19. Epub 2005 Jan 5.
8
Tree pattern matching in phylogenetic trees: automatic search for orthologs or paralogs in homologous gene sequence databases.系统发育树中的树形模式匹配:在同源基因序列数据库中自动搜索直系同源基因或旁系同源基因。
Bioinformatics. 2005 Jun 1;21(11):2596-603. doi: 10.1093/bioinformatics/bti325. Epub 2005 Feb 15.
9
The repertoire of G-protein-coupled receptors in fully sequenced genomes.全基因组测序中的G蛋白偶联受体库。
Mol Pharmacol. 2005 May;67(5):1414-25. doi: 10.1124/mol.104.009001. Epub 2005 Feb 1.
10
MUSCLE: a multiple sequence alignment method with reduced time and space complexity.MUSCLE:一种时间和空间复杂度降低的多序列比对方法。
BMC Bioinformatics. 2004 Aug 19;5:113. doi: 10.1186/1471-2105-5-113.